Os formatos de arquivos UNIX, DOS e MAC e como convertê-los
Os arquivos de tipo texto puro (geralmente txt) basicamente ficam disponíveis em três formatos que serão explicados a seguir: UNIX, DOS e MAC, mas antes você deve entender o que é o CR (\r) e o LF (\n).
CR ou \r significa Carriage Return LF ou \n significa Line Feed
Na época das impressoras matriciais, quando você mandava imprimir algo, o caractere CR era entendido pela impressora como Retornar o carro (cabeça de impressão) para o começo da linha e o caractere LF era entendido como subir a folha de modo que a impressão fosse para a próxima linha.
| Formato | Característica | Descrição | |
| UNIX | LF | \n | Um caractere apenas caracteriza a quebra de linha. Um LF (\n) faz o Unix entender que se deve mandar um CR para a impressora antes. - Não é recomendado que um arquivo do formato UNIX seja aberto pelo Bloco de Notas do Windows porque os LF que não são precedidos por CR serão trocados por quadrados. Recomenda-se usar o Wordpad. |
| DOS | CR+LF | \r\n | - Dois caracteres caracterizam a quebra de linha nesse formato. Tanto o DOS quanto o Windows precisam que os caracteres CR (\r) e LF (\n) estejam especificados no arquivo. - Somente agora o Windows está inserindo automaticamente: – um caractere CR quando este não está precedendo o LF; – um caractere LF quando este não está sucedendo o CR; – O DOS não faz estes ajustes automáticos. - Os editores de textos do Unix, geralmente em modo de depuração, exibem o caractere CR como ^M. |
| MAC | CR | \r | Este formato foi usado somente nos antigos Macintoshes. A partir do Mac OSX o formato de arquivos padrão passou a ser UNIX também porque o Mac OSX é baseado em Unix, assim como o Linux. Os Macintoshes automaticamente inseriam um LF após um CR caso o arquivo fosse enviado para a impressora. - Os editores de textos do Unix, geralmente em modo de depuração, exibem o caractere CR como ^M. - Não é recomendado que um arquivo do formato MAC seja aberto pelo Bloco de Notas do Windows porque os CR que não são sucedidos por LF serão trocados por quadrados. Recomenda-se usar o Wordpad. |
Vários editores de textos conseguem converter o arquivo de um formato em outro formato. Para o Windows existe alguns, como os gratuitos Win32Pad e o Notepad++. No Mac e no Linux usaremos o próprio Vim.
Se você ainda não conhece o básico do Vim [clique aqui].
Em modo de comando usaremos :set fileformat ou, simplesmente, :set ff.
:set ff=unix # Converte o arquivo para o formato UNIX. :set ff=dos # Converte o arquivo para o formato DOS. :set ff=mac # Converte o arquivo para o formato MAC. # Lembre de salvar o arquivo depois.
I found a great Unix tips article in the IBM website. Its a little old but I’m sure your readers will find it useful. Here’s the link http://www.ibm.com/developerworks/aix/library/au-badunixhabits.html