日本語処理のツール
下記は、日本語テキスト処理のための簡単なperlスクリプトです。いずれもフリーソフトです。
ただし、動作させるにはそれぞれの処理系に応じたperl(2についてはjperlのみ対応)が別途必要です。
Windows95,NT用のjperlの入手については、次のWebページの解説の「インストール手順」の部分を読んでください。
JPerl for MS-Windows
ツールリスト
- kgrep.pl(perlによるKWICスタイルの出力を持つgrep)
- count.pl(jperlによる日本語文字の頻度調査プログラム)
- ngmerge.pl(複数のngram処理の結果をmergeして対照する)
- linguist.pl(YahooAPIを使ってデータ収集)
-
- csjxml2txt.pl(XML::Simpleを使って話言葉corpusを処理する)
-