Bancos de Dados e Ferramentas de Análise
Bancos de Dados
Corpora do Projeto DIRECT
- Banco de Português (BP)
- Banco de Inglês
Corpora do Projeto EDULANG
Caixa de Ferramentas (Toolkit)
- Ferramentas básicas
- Enviar (upload) corpus
- Enviar (upload) de lista de freqüência de palavras
- Concordanciador
- Listador de freqüências
- Extrator de palavras-chave
- Listador de n-gramas (multipalavras, 'chunks')
- NSP - N-gram Statistical Package
- Etiquetagem
- Etiquetador online para português, inglês, alemão, francês, espanhol e italiano
- Conversão no BNC
- Análise de padronização léxico-gramatical
- Analisador de colocações para corpora (cálculo de Mutual Information e T-Score)
- Analisador de tabela de colocados do WordSmith Tools (cálculo de Mutual Information e T-Score)
- Analisador de colocações -- Calculadora de associação lexical (Mutual Information e T-Score)
- Comparador de conjuntos de colocados
- Analisador de coligações -- Contador de etiquetas de corpora etiquetados
- Web como corpus
- KWIC Google - Formatador de concordâncias a partir de resultados de busca do Google
- Análise de texto, discurso e gênero
- Extrator de textos-chave
- Segmentador de textos
- Analisador de coesão lexical - Identificador de ligações (links) e adesões (bonds)
- Estudos de tradução
- Alinhador de textos paralelos
- Estudos de metáfora
- Etiquetador de metáforas
- Analisador de metáforas
- Estudos de pronúncia
- Interface para dicionário CMU de pronúncia do inglês
- Estudos de semântica e relações lexicais
- Identificador de similaridade semântica (via WordNet)
Links externos
1999-2005 Tony Berber Sardinha