[ Corpus Tycho Brahe ]

quinta-feira, 25 de março de 2010

Corpus website maintenance, part one

We'd like to apologize for been out all day (25/Mar). We were updating many things at the same time, doing some clean up among other things. Soon (problably by monday) we'll list here all the updates made.

Our website will be online this weekend and we hope no bug to show up. But if it does, please let us know by the email corpustb@gmail.com.

terça-feira, 23 de fevereiro de 2010

Web Server eventually offline

Our server has been offline sometimes in the last two months. This is due to two main reasons: we are upgrading our web server to a faster and reliable one; and the network at which it is hosted is passing throught an upgrade too. We - from Tycho Brahe Project team - would like to apologize for this inconvenience believing that it will be compensated by a faster and stable service from now on.

Best wishes,

terça-feira, 30 de junho de 2009

Novo texto com análise sintática disponível / New parsed text available

O texto abaixo possui anotação sintática disponível:

* [c_002] Maria do Céu (1658) - Vida e Morte de Madre Helena da Cruz

Dois textos ainda estão em revisão (a_004 e s_001).

---------

Above, you have the link to the new parsed text (c_002). Other texts are still under revision (a_004 and s_001).

sexta-feira, 27 de fevereiro de 2009

Pesquisa (Research)

Novos textos e dados da produção acadêmica relacionada ao corpus foram inseridos no site (aqui). São artigos, capítulos de livros/anais, teses/dissertações e informações sobre comunicações/participações em congressos.

---

New papers and data related to the academic research under the Tycho Brahe Project are available (here). These include articles, book chapters, dissertation/thesis and info about presentations on events.

Atualizações XML e POS (XML and POS update)

Foram feitas várias (pequenas) atualizações nos arquivos XML do corpus, em função da necessidade de regerar as versões etiquetadas não-revisadas dos textos. Além disso, foram incluídas versões etiquetadas dos textos a_006, b_002, b_007, d_001, m_001, o_002, s_002, s_003. Agora temos um total de 51 textos etiquetados (entre revisados e não revisados), todos acessíveis através da busca web.

---

Many (short) updates were made on the XML files of the corpus so we could (re)tag the unrevised POS files and to tag more (a_006, b_002, b_007, d_001, m_001, o_002, s_002, s_003). Now we have 51 tagged texts (among revised and unrevised), all available through the web query.

terça-feira, 13 de janeiro de 2009

Novo Manual Sintático / New Syntax Annotation Manual

O novo manual sintático está disponível na página do corpus, aqui. Ainda receberá alguns pequenos ajustes extras, mas já está quase finalizado.

The new syntax annotation manual is available online, here. There are still some minor fixes to do, but in general it is quite complete.

terça-feira, 14 de outubro de 2008

Textos parseados disponíveis / Parsed texts available

Os textos que estavam em revisão estão disponíveis novamente. São eles:
  • [a_001] Aires (1705) - Reflexões sobre a Vaidade dos Homens
  • [a_003] Alorna (1802) - Memórias do Marquês da Fronteira e d'Alorna
  • [b_001] Barros (1675) - Vida do apostólico padre Antonio Vieira
Outros três textos serão parseados em breve e, após revisão, deverão ser disponibilizados dentro de alguns meses.

---------

The three parsed texts linked above are available again, after a deep revision. Three other texts will be submitted to the parser soon.