CEPRIL, LAEL

Bancos de Dados e Ferramentas de Análise

Bancos de Dados

Corpora do Projeto DIRECT

Corpora do Projeto EDULANG

Caixa de Ferramentas (Toolkit)

  1. Ferramentas básicas
    1. Enviar (upload) corpus
    2. Enviar (upload) de lista de freqüência de palavras
    3. Concordanciador
    4. Listador de freqüências
    5. Extrator de palavras-chave
    6. Listador de n-gramas (multipalavras, 'chunks')
    7. NSP - N-gram Statistical Package
  2. Etiquetagem
    1. Etiquetador online para português, inglês, alemão, francês, espanhol e italiano
    2. Conversão no BNC
  3. Análise de padronização léxico-gramatical
    1. Analisador de colocações para corpora (cálculo de Mutual Information e T-Score)
    2. Analisador de tabela de colocados do WordSmith Tools (cálculo de Mutual Information e T-Score)
    3. Analisador de colocações -- Calculadora de associação lexical (Mutual Information e T-Score)
    4. Comparador de conjuntos de colocados
    5. Analisador de coligações -- Contador de etiquetas de corpora etiquetados
  4. Web como corpus
    1. KWIC Google - Formatador de concordâncias a partir de resultados de busca do Google
  5. Análise de texto, discurso e gênero
    1. Extrator de textos-chave
    2. Segmentador de textos
    3. Analisador de coesão lexical - Identificador de ligações (links) e adesões (bonds)
  6. Estudos de tradução
    1. Alinhador de textos paralelos
  7. Estudos de metáfora
    1. Etiquetador de metáforas
    2. Analisador de metáforas
  8. Estudos de pronúncia
    1. Interface para dicionário CMU de pronúncia do inglês
  9. Estudos de semântica e relações lexicais
    1. Identificador de similaridade semântica (via WordNet)

Links externos


1999-2005 Tony Berber Sardinha