Alinhador online de textos paralelos (Vanilla aligner)

CEPRIL, LAEL, PUC/SP

Para que serve

Como usar

É possível alinhar somente dois textos de cada vez. Não importa a língua dos textos.

  1. Copie um texto de cada vez e cole-o um em uma das janelas localizadas abaixo (Texto 1 ou Texto 2). A ordem não importa. Não há limite conhecido de tamanho dos textos. Eles podem ser maiores do que o tamanho visível da janela. Ao colar, certifique-se de que os textos não estão truncados.
  2. Indique se ambos os textos estão itemizados ou não (ambos os textos devem estar no mesmo formato).
  3. Indique os códigos de divisão usados nos dois textos (ambos os textos devem ter sido anotados com os mesmos códigos de divisão).
  4. Clique em Alinhar.

Formatação dos textos a serem alinhados

Exemplo de textos alinhados com este alinhador

Outras informações

  1. O programa é baseado no alinhador 'char_align' de 1991, de Church e Gale, descrito no artigo de 1993.
  2. O código usado nesta implementação é a fonte do etiquetador 'Vanilla' disponibilizado em linguagem C por Pernilla Danielsson e Daniel Ridings (Universidade de Goteburgo, Suécia) em seu paper de 1997.
  3. O alinhador é independente de língua ('language independent'), ou seja, consegue alinhar qualquer língua com qualquer outra (desde que os textos tenham sido anotados segundo as normas descritas abaixo).
  4. O alinhador funciona com um método baseado em caracteres, não em palavras ou parágrafos. O alinhador presume que 'a translation of a unit in one language, for example a sentence, will be represented by a unit that is approximately of the same length in another language.' (Danielsson e Ridings 1997).
  5. Esse alinhador foi citado numa discussão na lista CORPORA sobre alinhadores em 2002, resumida por Tony Berber Sardinha.
  6. Há uma versão em DOS para esse alinhador.
  7. Você pode baixar o binário para Linux.

Erros

Possíveis causas:
  1. A sua escolha de marcador e de itemização não correspondem às usadas nos DOIS textos.
  2. A sua escolha de marcador está invertida (o de unidade maior está indicado para a unidade menor e vice-versa).
  3. O servidor pode estar sobrecarregado. Tente novamente mais tarde, por favor.
  4. Lembre-se de que os marcadores devem ser padronizados, usados consistentemente ao longo dos dois textos e aparecer em linhas separadas (não juntamente com outras palavras na mesma linha).

Referências


Os textos estão itemizados?

Códigos de divisão:

Divisão maior (p.ex. parágrafo):
Se outro, especifique

Divisão menor (p.ex. sentença):
Se outro, especifique


Texto 1:

Língua:

Outras informações opcionais (gênero, autor, data, etc.):

Texto:


Texto 2:

Língua:

Outras informações opcionais (gênero, autor, data, etc.):

Texto:


char_align: William Gale & Ken Church
align.c: Pernilla Danielsson & Daniel Ridings
cgi, html: Tony Berber Sardinha.