Gemini オンラインマニュアル

差分翻訳

セクションのテキスト部分はpタグ<p>~</p>で一段落ごとで構成されている。 pタグにはそれぞれp_idという様々な条件から割り当てられた文字列が付与されている。(表には出ない) p_idごとにすべてのテキスト情報をデータベースに保存して相互に翻訳関係を持たせ、過去に翻訳した文章を再翻訳しなくてもよくするための機能。

  • 通常翻訳との違い 通常は翻訳書き出しをする際にAction列にhと入れるが、差分翻訳をする際にはh-○○と入れる。 ○○に入れるアルファベットは翻訳先言語が入る。「セクション」の言語参照。
    geminidocs-10-07-01-00_4

    通常翻訳

    geminidocs-10-07-01-00_5

    差分翻訳[en(英文)の場合]

    書きだされた翻訳用xmlに差分翻訳ではp_idではなくparent_idが付与されている。
    geminidocs-10-07-01-00_1

    通常翻訳

    geminidocs-10-07-01-00_2

    差分翻訳[en(英文)の場合]

    差分翻訳で書きだした際に、既に過去、他言語(今回はen)が差分翻訳によって紐付けされていた場合、parent_idではなく、紐付けされている他言語のp_idを引っ張ってくる。
    geminidocs-10-07-01-00_4

    過去おはようございますを翻訳済の時に差分翻訳[h-en]を行った場合

    この場合、<p p_id=”ad1b1339c9851b9766f385fef23ea8a9″>と<p p_id=”8fb278bbcd0c073b636231064067142e”>が紐付いて相互に翻訳関係を持っている。
  •  
    p_idを紐付けさせるには、翻訳時にh-○○で翻訳書き出しをし、後は通常と同様の翻訳の工程を行う。
    hのみで書きだしたxml(parent_idのないxml)で翻訳しても紐付けはされない。
     
  • 言語が派生した場合 和文→英文で翻訳した後に英文から中文を作成する等、翻訳先言語から更に翻訳言語が派生した場合の関係は下図のようになる。 geminidocs-10-07-01-00_6
    このように、parent_idを辿ってゆき、各派生言語同士は紐付く。

注意事項

  • p(arent)_idが付与されたpタグをコピーして使用しない
  • parent_idが付与されたxmlをGeminiに投げない
  • 相互関係にある翻訳先テキストを修正する際にはもう一度翻訳処理を行なう
    geminidocs-10-07-01-00_7
    修正すると上図のような関係となる。つまり、どの翻訳先とも関係性がなくなる。 なので一旦英文セクションを抹消し、もう一度和文の翻訳用xmlを書き出し、修正後のテキストを入れて翻訳処理する必要がある。 次回また翻訳コストが発生しても構わない場合はそのまま放置しても問題ない。(差分翻訳書き出し時に相互関係のp_idがないためparent_idで出てくる)