TSV (Valores Separados por Tabulacao)
TSV e um formato de ficheiro de texto que armazena dados tabulares utilizando caracteres de tabulacao para separar valores. Oferece uma alternativa ao CSV que evita problemas com virgulas incorporadas nos dados.
Tipo MIME
text/tab-separated-values
Tipo
Texto
Compressão
Sem perdas
Vantagens
- + Simpler parsing than CSV — no quoting rules needed
- + Tabs rarely appear in data, reducing ambiguity
- + Standard in bioinformatics and scientific data pipelines
Desvantagens
- − Less universally recognized than CSV in business tools
- − Cannot represent values containing tab characters
- − Some spreadsheet tools default to CSV, not TSV
Quando usar .TSV
Use TSV quando os dados contenham virgulas que complicariam a analise CSV, ou ao trabalhar com ferramentas bioinformaticas e pipelines de dados.
Detalhes técnicos
O TSV utiliza o caractere de tabulacao horizontal (U+0009) como delimitador de campo. Ao contrario do CSV, o TSV geralmente nao utiliza aspas, tornando a analise mais simples, mas impedindo tabulacoes literais nos valores dos campos.
Histórico
Os ficheiros delimitados por tabulacao tem sido utilizados desde os primeiros sistemas Unix para troca de dados. A IANA registou o tipo MIME text/tab-separated-values, e o formato e amplamente utilizado em bioinformatica e ciencia de dados.