Os formatos de arquivos UNIX, DOS e MAC e como convertê-los

Os arquivos de tipo texto puro (geralmente txt) basicamente ficam disponíveis em três formatos que serão explicados a seguir: UNIX, DOS e MAC, mas antes você deve entender o que é o CR (\r) e o LF (\n).

CR ou \r significa Carriage Return
LF ou \n significa Line Feed

Na época das impressoras matriciais, quando você mandava imprimir algo, o caractere CR era entendido pela impressora como Retornar o carro (cabeça de impressão) para o começo da linha e o caractere LF era entendido como subir a folha de modo que a impressão fosse para a próxima linha.

Formato Característica Descrição
UNIX LF \n Um caractere apenas caracteriza a quebra de linha. Um LF (\n) faz o Unix entender que se deve mandar um CR para a impressora antes.
- Não é recomendado que um arquivo do formato UNIX seja aberto pelo Bloco de Notas do Windows porque os LF que não são precedidos por CR serão trocados por quadrados. Recomenda-se usar o Wordpad.
DOS CR+LF \r\n - Dois caracteres caracterizam a quebra de linha nesse formato. Tanto o DOS quanto o Windows precisam que os caracteres CR (\r) e LF (\n) estejam especificados no arquivo.
- Somente agora o Windows está inserindo automaticamente:
  – um caractere CR quando este não está precedendo o LF;
  – um caractere LF quando este não está sucedendo o CR;
  – O DOS não faz estes ajustes automáticos.
- Os editores de textos do Unix, geralmente em modo de depuração, exibem o caractere CR como ^M.
MAC CR \r Este formato foi usado somente nos antigos Macintoshes. A partir do Mac OSX o formato de arquivos padrão passou a ser UNIX também porque o Mac OSX é baseado em Unix, assim como o Linux. Os Macintoshes automaticamente inseriam um LF após um CR caso o arquivo fosse enviado para a impressora.
- Os editores de textos do Unix, geralmente em modo de depuração, exibem o caractere CR como ^M.
- Não é recomendado que um arquivo do formato MAC seja aberto pelo Bloco de Notas do Windows porque os CR que não são sucedidos por LF serão trocados por quadrados. Recomenda-se usar o Wordpad.

Vários editores de textos conseguem converter o arquivo de um formato em outro formato. Para o Windows existe alguns, como os gratuitos Win32Pad e o Notepad++. No Mac e no Linux usaremos o próprio Vim.

Se você ainda não conhece o básico do Vim [clique aqui].

Em modo de comando usaremos :set fileformat ou, simplesmente, :set ff.

:set ff=unix # Converte o arquivo para o formato UNIX.
:set ff=dos  # Converte o arquivo para o formato DOS.
:set ff=mac  # Converte o arquivo para o formato MAC.

# Lembre de salvar o arquivo depois.

One Response to “Os formatos de arquivos UNIX, DOS e MAC e como convertê-los”

Leave a Reply

*