Got raw sequencing data from a lab? We'll turn it into a genotype file you can import directly into LifeGenix — no bioinformatics experience needed.
Tem dados brutos de sequenciamento de um laboratório? Nós convertemos em um arquivo de genótipo compatível com a LifeGenix — sem precisar saber bioinformática.
A FASTQ file is the raw output from a DNA sequencing machine (such as Illumina NovaSeq or BGI DNBSEQ). It contains millions of short DNA fragments — called "reads" — along with a quality score for every single base. Think of it as the unprocessed photograph of your DNA: packed with data, but it needs to be aligned to a reference genome and analyzed before it becomes useful.
Services like 23andMe or Genera use a genotyping chip — a microarray that reads ~650,000 pre-selected DNA positions. Every position gets a reliable call, and you get a clean text file ready to upload. Sequencing is different: a machine reads your DNA base-by-base, producing raw reads that must be computationally assembled and analyzed.
Unless you paid for 30x whole-genome sequencing, your FASTQ probably comes from a targeted panel or clinical exome. These tests focus the sequencing budget on specific genes or regions of interest — for example a cardiology panel, a pharmacogenomics panel, or a clinical exome covering ~20,000 genes.
Inside the targeted regions, the sequencer reads the same stretch of DNA many times over — typically 100x to 300x coverage or more. That redundancy is what gives clinical-grade confidence. But outside those regions, stray reads still land on the rest of the genome at very low coverage — just 1x or 2x — essentially random fragments that happened to be captured.
When we align your reads to the reference genome and call variants, we get results across the entire genome — but most of them are unreliable. A position covered by just 1 or 2 reads could easily be a sequencing error rather than a real variant. That's why we output results in confidence tiers:
For a typical panel, Tier A+B might give you 50,000–200,000 high-confidence variants (the panel targets), while Tier D adds hundreds of thousands more from off-target reads that are statistically unreliable. More variants ≠ better data. If you're not sure, start with Tier A+B.
We align your raw FASTQ reads against the GRCh37/hg19 human reference genome using BWA-MEM2, call variants with BCFtools mpileup (multi-pass pileup across all aligned positions), then filter and tier the results by read depth. The output is a genotype text file in the same format used by 23andMe and Genera — upload it to LifeGenix and get your analysis instantly.
The genotyping platforms that LifeGenix, 23andMe, and Genera use are all built on GRCh37 (hg19) — the same reference build used by dbSNP rsIDs and the vast majority of consumer genetics tools. While GRCh38 is the newer assembly, using it would produce chromosome coordinates that don't match what these platforms expect, causing variants to be silently mismatched or dropped during import.
We always output in GRCh37 for maximum compatibility with LifeGenix, 23andMe, and Genera.
Um arquivo FASTQ é a saída bruta de uma máquina de sequenciamento de DNA (como Illumina NovaSeq ou BGI DNBSEQ). Ele contém milhões de fragmentos curtos de DNA — chamados "reads" — junto com uma pontuação de qualidade para cada base. Pense nele como a foto crua do seu DNA: cheio de dados, mas que precisa ser alinhado a um genoma de referência e analisado antes de ser útil.
Serviços como 23andMe ou Genera usam um chip de genotipagem — um microarray que lê ~650.000 posições de DNA pré-selecionadas. Cada posição tem uma leitura confiável, e você recebe um arquivo de texto pronto pra usar. Já o sequenciamento é diferente: a máquina lê seu DNA base por base, gerando reads brutos que precisam ser alinhados e analisados computacionalmente.
A não ser que você tenha feito um sequenciamento de genoma completo a 30x, seu FASTQ provavelmente vem de um painel direcionado ou exoma clínico. Esses exames concentram o sequenciamento em genes ou regiões específicas — por exemplo um painel cardiológico, farmacogenômico, ou um exoma clínico cobrindo ~20.000 genes.
Dentro das regiões-alvo, o sequenciador lê o mesmo trecho de DNA várias vezes — geralmente 100x a 300x de cobertura ou mais. Essa redundância é o que garante confiança clínica. Mas fora dessas regiões, reads soltos acabam caindo no resto do genoma com cobertura muito baixa — só 1x ou 2x — basicamente fragmentos aleatórios que foram capturados por acaso.
Quando alinhamos seus reads ao genoma de referência e identificamos variantes, temos resultados pelo genoma inteiro — mas a maioria não é confiável. Uma posição coberta por só 1 ou 2 reads pode ser simplesmente um erro de sequenciamento, e não uma variante real. Por isso geramos os resultados em níveis de confiança:
Num painel típico, o Tier A+B pode gerar 50.000–200.000 variantes de alta confiança (os alvos do painel), enquanto o Tier D adiciona centenas de milhares a mais vindas de reads fora do alvo, estatisticamente não confiáveis. Mais variantes ≠ dados melhores. Na dúvida, comece pelo Tier A+B.
Alinhamos seus reads FASTQ brutos ao genoma humano de referência GRCh37/hg19 usando BWA-MEM2, identificamos variantes com BCFtools mpileup (pileup multi-passagem em todas as posições alinhadas), e filtramos os resultados por profundidade de leitura. O resultado é um arquivo de genótipo no mesmo formato usado por 23andMe e Genera — é só fazer upload na LifeGenix e receber sua análise na hora.
As plataformas de genotipagem que a LifeGenix, 23andMe e Genera usam são todas baseadas no GRCh37 (hg19) — o mesmo build de referência usado pelos rsIDs do dbSNP e pela grande maioria das ferramentas de genética voltadas ao consumidor. Apesar do GRCh38 ser a versão mais recente, usar ele geraria coordenadas cromossômicas que não batem com o que essas plataformas esperam, fazendo com que variantes fiquem incompatíveis ou sejam descartadas na hora de importar.
Sempre geramos em GRCh37 para máxima compatibilidade com a LifeGenix, 23andMe e Genera.
or click to browse your computer
ou clique para buscar no seu computador
Conversions run one at a time on our server. Depending on queue length and file size, it can take from a few minutes to over an hour. You'll get a bookmark link so you can close this page and come back anytime.
As conversões são executadas uma por vez no nosso servidor. Dependendo da fila e do tamanho do arquivo, pode levar de alguns minutos a mais de uma hora. Você vai receber um link para salvar e voltar quando quiser.