Index > jdom

jdom

Wed, September 16, 2009

数値文字参照(Numeric Character Reference)をJDOMで使いたい

数値文字参照 を含んだXMLをJDOMで生成するにはどうすればいいのか?と思って調べてみたのだが、 そのまま数値文字参照をテキストとしてセットする方法がわからなかった。

以下のような代替案で対処したので、メモしておきます。

続きを読む

Thu, August 27, 2009

日本語XML文書を英語に翻訳する(GoogleのTranslate API を使用)

Google Translate API を使うといろいろな言語に品質はともかく簡単に翻訳することができます。

今回は、 前回のエントリXML文書から テキストノード text() を抜き出す方法 とGoogle TranslateAPIを使って、日本語XML文書を英語に翻訳してみます。

XMLを使った多言語展開のドキュメント制作においては、 元になる言語のマニュアルが完成すれば、あとは基本的にXML文書さえ翻訳すれば 多言語のマニュアルはほぼ完成します...と言いたいところですが、 実際は多言語に展開するにあたって、その展開先言語に固有の問題があり、 それに対処しなければなりません。

たとえば、日本語から英語に翻訳する場合、 文字量が変わる(増える)ことによるレイアウト調整や改ページ位置の調整などの ページネーション処理が必要になります。

したがって、実際の翻訳前に機械的に翻訳した英語データを使ってレイアウト調整を 行うことは意味があります。

続きを読む

Wed, August 26, 2009

XML文書から テキストノード text() を抜き出す方法

googleのTranslate APIを使って、XML文書を日本語から英語に翻訳する ためには、まず、翻訳対象のXML文書中でテキストノードを取り出す必要がある。

単にテキストノードを取り出すだけならば、 XPath で指定した特定部分だけをXML文書から抜き出すスタイルシート のようにXSLTを使えば済む話だが、 その取り出したテキストを

  1. 日本語から英語に翻訳した上で
  2. 翻訳した英語テキストを元の場所に書き戻す必要がある

のでXSLTだけでは厳しい。

そこで、例によってJDOMとJythonを使って、問題を解決する。

続きを読む

 Twitter
follow me on Twitter
 Categories
 Archives