Convert your FASTQ files
for use on LifeGenix

Converta seus arquivos FASTQ
para usar na LifeGenix

Got raw sequencing data from a lab? We'll turn it into a genotype file you can import directly into LifeGenix — no bioinformatics experience needed.

Tem dados brutos de sequenciamento de um laboratório? Nós convertemos em um arquivo de genótipo compatível com a LifeGenix — sem precisar saber bioinformática.

Completely free Queued processing Deleted after 24h
100% gratuito Processamento em fila Apagado em 24h

What is a FASTQ file?

A FASTQ file is the raw output from a DNA sequencing machine (such as Illumina NovaSeq or BGI DNBSEQ). It contains millions of short DNA fragments — called "reads" — along with a quality score for every single base. Think of it as the unprocessed photograph of your DNA: packed with data, but it needs to be aligned to a reference genome and analyzed before it becomes useful.

Genotyping chips vs. sequencing

Services like 23andMe or Genera use a genotyping chip — a microarray that reads ~650,000 pre-selected DNA positions. Every position gets a reliable call, and you get a clean text file ready to upload. Sequencing is different: a machine reads your DNA base-by-base, producing raw reads that must be computationally assembled and analyzed.

Genotyping chip
~650K SNPs
Fixed set of pre-selected positions. Every position gets a confident call. Ready-to-use text file output.
Sequencing (FASTQ)
Millions of reads
Reads DNA base-by-base. Coverage varies wildly across the genome. Requires alignment and variant calling.

Most FASTQ files come from panels, not whole genomes

Unless you paid for 30x whole-genome sequencing, your FASTQ probably comes from a targeted panel or clinical exome. These tests focus the sequencing budget on specific genes or regions of interest — for example a cardiology panel, a pharmacogenomics panel, or a clinical exome covering ~20,000 genes.

Inside the targeted regions, the sequencer reads the same stretch of DNA many times over — typically 100x to 300x coverage or more. That redundancy is what gives clinical-grade confidence. But outside those regions, stray reads still land on the rest of the genome at very low coverage — just 1x or 2x — essentially random fragments that happened to be captured.

Why only a subset of variants is reliable

When we align your reads to the reference genome and call variants, we get results across the entire genome — but most of them are unreliable. A position covered by just 1 or 2 reads could easily be a sequencing error rather than a real variant. That's why we output results in confidence tiers:

A+BHigh confidence — 10+ reads (DP ≥ 10). These are positions the sequencer read many times. >99% accuracy. This is your panel's sweet spot.
A+B+CModerate — 5+ reads (DP ≥ 5). Still solid for most purposes, ~95% accuracy. Includes the edges of targeted regions.
A+B+C+DEverything — 2+ reads (DP ≥ 2). Includes off-target and low-coverage areas. Use with caution — many of these calls may be noise.

For a typical panel, Tier A+B might give you 50,000–200,000 high-confidence variants (the panel targets), while Tier D adds hundreds of thousands more from off-target reads that are statistically unreliable. More variants ≠ better data. If you're not sure, start with Tier A+B.

What this converter does

We align your raw FASTQ reads against the GRCh37/hg19 human reference genome using BWA-MEM2, call variants with BCFtools mpileup (multi-pass pileup across all aligned positions), then filter and tier the results by read depth. The output is a genotype text file in the same format used by 23andMe and Genera — upload it to LifeGenix and get your analysis instantly.

Why GRCh37 and not GRCh38?

The genotyping platforms that LifeGenix, 23andMe, and Genera use are all built on GRCh37 (hg19) — the same reference build used by dbSNP rsIDs and the vast majority of consumer genetics tools. While GRCh38 is the newer assembly, using it would produce chromosome coordinates that don't match what these platforms expect, causing variants to be silently mismatched or dropped during import.

We always output in GRCh37 for maximum compatibility with LifeGenix, 23andMe, and Genera.

O que é um arquivo FASTQ?

Um arquivo FASTQ é a saída bruta de uma máquina de sequenciamento de DNA (como Illumina NovaSeq ou BGI DNBSEQ). Ele contém milhões de fragmentos curtos de DNA — chamados "reads" — junto com uma pontuação de qualidade para cada base. Pense nele como a foto crua do seu DNA: cheio de dados, mas que precisa ser alinhado a um genoma de referência e analisado antes de ser útil.

Chips de genotipagem vs. sequenciamento

Serviços como 23andMe ou Genera usam um chip de genotipagem — um microarray que lê ~650.000 posições de DNA pré-selecionadas. Cada posição tem uma leitura confiável, e você recebe um arquivo de texto pronto pra usar. Já o sequenciamento é diferente: a máquina lê seu DNA base por base, gerando reads brutos que precisam ser alinhados e analisados computacionalmente.

Chip de genotipagem
~650K SNPs
Conjunto fixo de posições pré-selecionadas. Cada posição tem leitura confiável. Gera um arquivo de texto pronto pra usar.
Sequenciamento (FASTQ)
Milhões de reads
Lê o DNA base por base. A cobertura varia enormemente pelo genoma. Requer alinhamento e chamada de variantes.

A maioria dos FASTQ vem de painéis, não do genoma completo

A não ser que você tenha feito um sequenciamento de genoma completo a 30x, seu FASTQ provavelmente vem de um painel direcionado ou exoma clínico. Esses exames concentram o sequenciamento em genes ou regiões específicas — por exemplo um painel cardiológico, farmacogenômico, ou um exoma clínico cobrindo ~20.000 genes.

Dentro das regiões-alvo, o sequenciador lê o mesmo trecho de DNA várias vezes — geralmente 100x a 300x de cobertura ou mais. Essa redundância é o que garante confiança clínica. Mas fora dessas regiões, reads soltos acabam caindo no resto do genoma com cobertura muito baixa — só 1x ou 2x — basicamente fragmentos aleatórios que foram capturados por acaso.

Por que apenas parte das variantes é confiável

Quando alinhamos seus reads ao genoma de referência e identificamos variantes, temos resultados pelo genoma inteiro — mas a maioria não é confiável. Uma posição coberta por só 1 ou 2 reads pode ser simplesmente um erro de sequenciamento, e não uma variante real. Por isso geramos os resultados em níveis de confiança:

A+BAlta confiança — 10+ reads (DP ≥ 10). Posições lidas várias vezes pelo sequenciador. >99% de acurácia. O ponto forte do seu painel.
A+B+CModerada — 5+ reads (DP ≥ 5). Ainda bom pra maioria dos usos, ~95% de acurácia. Inclui as bordas das regiões-alvo.
A+B+C+DTudo — 2+ reads (DP ≥ 2). Inclui áreas fora do alvo e de baixa cobertura. Use com cautela — muitos desses resultados podem ser ruído.

Num painel típico, o Tier A+B pode gerar 50.000–200.000 variantes de alta confiança (os alvos do painel), enquanto o Tier D adiciona centenas de milhares a mais vindas de reads fora do alvo, estatisticamente não confiáveis. Mais variantes ≠ dados melhores. Na dúvida, comece pelo Tier A+B.

O que este conversor faz

Alinhamos seus reads FASTQ brutos ao genoma humano de referência GRCh37/hg19 usando BWA-MEM2, identificamos variantes com BCFtools mpileup (pileup multi-passagem em todas as posições alinhadas), e filtramos os resultados por profundidade de leitura. O resultado é um arquivo de genótipo no mesmo formato usado por 23andMe e Genera — é só fazer upload na LifeGenix e receber sua análise na hora.

Por que GRCh37 e não GRCh38?

As plataformas de genotipagem que a LifeGenix, 23andMe e Genera usam são todas baseadas no GRCh37 (hg19) — o mesmo build de referência usado pelos rsIDs do dbSNP e pela grande maioria das ferramentas de genética voltadas ao consumidor. Apesar do GRCh38 ser a versão mais recente, usar ele geraria coordenadas cromossômicas que não batem com o que essas plataformas esperam, fazendo com que variantes fiquem incompatíveis ou sejam descartadas na hora de importar.

Sempre geramos em GRCh37 para máxima compatibilidade com a LifeGenix, 23andMe e Genera.

Upload
FASTQ
Upload
FASTQ
Align to
genome
Alinhar ao
genoma
Call
variants
Identificar
variantes
Download
genotype
Baixar
genótipo

About you

Sobre você

Tell us a bit about yourself so we can improve this service.
Conte um pouco sobre você para nos ajudar a melhorar este serviço.
* Email is required. The rest is optional but helps us a lot.
* Email é obrigatório. O restante é opcional, mas nos ajuda bastante.

Drop your sequencing file here

Arraste seu arquivo de sequenciamento aqui

or click to browse your computer

ou clique para buscar no seu computador

.zip.tar.gz.fastq.gz

Free service — jobs are queued

Serviço gratuito — processamento em fila

Conversions run one at a time on our server. Depending on queue length and file size, it can take from a few minutes to over an hour. You'll get a bookmark link so you can close this page and come back anytime.

As conversões são executadas uma por vez no nosso servidor. Dependendo da fila e do tamanho do arquivo, pode levar de alguns minutos a mais de uma hora. Você vai receber um link para salvar e voltar quando quiser.

StorageArmazenamento
--
Loading...
QueueFila
--
Loading...
Status

Your results are ready

Seus resultados estão prontos