Index (June 2007)
Wiki記法で記述されたテキストをプレーンテキストに変換する(PEAR Text_Wiki)
Wiki記法で書かれたテキストをプレーンテキストに変換する方法。
単に、PEARの Text_Wiki モジュールで、{strong:xhtml} の代りに {strong:plain} を指定すればOK。
別の方法としては、xhtml に変換したあとに、 HTMLタグを除去する方法もある。
HTMLのマークアップを除去する...HTML文書からテキストファイルを作成(Javaを使用)
HTMLのマークアップをJavaで除去する簡単な方法はないか、と調べてみると、 javax.swing.text.html.HTMLEditorKit.ParserCallback という 標準のJavaのクラスライブラリに含まれているクラスでできることが判明。
関連エントリー
XSLTを使えばもっと簡単に処理できることが判明。ただし、対象となるファイルは well-formed な XML,XHTML。
PHP5のウインドウズへのインストール
WindowsへのPHPのインストールは、Linuxのように apt-get ... で簡単に インストールできなさそうだったので、避けてきたのだが、 結局インストールすることにした。
MacOSXにPHP5を導入したい
MacOSX10.4では現在のところ PHPのバージョンは4。 PEARのText_Wikiモジュールが使えないなど不便があったので、PHP5を導入した。
MediaWiki記法で記述されたテキストをHTMLに変換する(PEAR TextWikiMediawiki)
前回Wiki記法で書かれたテキストをPEARのTextWikiを使って HTMLに変換することができたが、 Wikipediaは、MediaWikiを使っているため、TextWikiだけでは、不十分。 そこで、TextWikiMediawikiというモジュールを使用することにした。
50音インデックス素材の生成ツール(Jython)
ウェブサイトで辞書コンテンツをつくる必要があり、50音のインデックス素材を作成した。
何しろ数が多いので、プログラムで生成するようにしました。
senhelper...形態素解析ツールSenを簡単に使うためのAPI
Senについてはこちらを ご覧いただくことにして、 これを簡単に使うためのラッパーを用意しました。
もともと、Sen自体簡単に使えるようになっているのですが、 もっと簡単に使いたかったので用意しました。
※このエントリは書きかけです。