Index > Index (June 2007)

Index (June 2007)

Thu, June 28, 2007

Wiki記法で記述されたテキストをプレーンテキストに変換する(PEAR Text_Wiki)

Wiki記法で書かれたテキストをプレーンテキストに変換する方法。

単に、PEARの Text_Wiki モジュールで、{strong:xhtml} の代りに {strong:plain} を指定すればOK。

別の方法としては、xhtml に変換したあとに、 HTMLタグを除去する方法もある。

続きを読む

Thu, June 28, 2007

HTMLのマークアップを除去する...HTML文書からテキストファイルを作成(Javaを使用)

HTMLのマークアップをJavaで除去する簡単な方法はないか、と調べてみると、 javax.swing.text.html.HTMLEditorKit.ParserCallback という 標準のJavaのクラスライブラリに含まれているクラスでできることが判明。

関連エントリー

XSLTを使えばもっと簡単に処理できることが判明。ただし、対象となるファイルは well-formed な XML,XHTML。

続きを読む

Tue, June 26, 2007

PHP5のウインドウズへのインストール

WindowsへのPHPのインストールは、Linuxのように apt-get ... で簡単に インストールできなさそうだったので、避けてきたのだが、 結局インストールすることにした。

続きを読む

Sat, June 23, 2007

MacOSXにPHP5を導入したい

MacOSX10.4では現在のところ PHPのバージョンは4。 PEARのText_Wikiモジュールが使えないなど不便があったので、PHP5を導入した。

続きを読む

Fri, June 22, 2007

MediaWiki記法で記述されたテキストをHTMLに変換する(PEAR TextWikiMediawiki)

前回Wiki記法で書かれたテキストをPEARのTextWikiを使って HTMLに変換することができたが、 Wikipediaは、MediaWikiを使っているため、TextWikiだけでは、不十分。 そこで、TextWikiMediawikiというモジュールを使用することにした。

続きを読む

Wed, June 20, 2007

50音インデックス素材の生成ツール(Jython)

ウェブサイトで辞書コンテンツをつくる必要があり、50音のインデックス素材を作成した。
何しろ数が多いので、プログラムで生成するようにしました。

続きを読む

Tue, June 19, 2007

senhelper...形態素解析ツールSenを簡単に使うためのAPI

Senについてはこちらを ご覧いただくことにして、 これを簡単に使うためのラッパーを用意しました。

もともと、Sen自体簡単に使えるようになっているのですが、 もっと簡単に使いたかったので用意しました。

※このエントリは書きかけです。

 Twitter
follow me on Twitter
 Categories
 Archives