2010年9月25日土曜日

翻訳便利ツール (1) - Grep

正規表現はとても便利ですが、ある程度の勉強が必要です。ということで、翻訳業で生計を立てていく中で、手放せなくなったツールを紹介していこうかなと思います。おそらく、既に多くの翻訳者が使用していると思います。

今回は GREP について話します。ちなみに、元はライン エディタのコマンド g/re/p からきています。つまり、「全体から (Global) 正規表現 (Regular Expression) に一致する行を表示 (Print) する」という意味です。


翻訳で取引を開始すると、翻訳対象ファイル以外に多くの資料を受け取ると思います。UI 対訳リスト、固定対訳表、翻訳仕様書、関連製品資料、その他の資料などです。

技術翻訳であれば、最低でも数ファイル、多いときで数十ファイルの資料が送られてきます。形式は、テキスト、MS Excel、MS Word、HTML、PDF などさまざまです。これらをいちいち開いて検索してなどいられません。数万語クラスの対訳であれば、MultiTerm に変換してしまいますが、こまごまとした 20 ファイルなど検索していられません。

エージェントにとって大事なお客さんであれば、データベース化して末端の翻訳者まで配布するのが筋だと思いますが、そんなことする時間はないのでしょうね。

不明 UI やスタイルに出会うたびに、Excel 検索 → Notepad 検索 → Word 検索 → Acrobat 検索 → TTX 検索なんてやっていられません。これらをそのまま横断検索できたら便利ですよね。Windows 標準の検索は精度が悪くてあまり使えません。

そこで Grep ですよ。使用に耐えるものはいくつかありますが、資料検索で私がずーっと使用している VxGrep を紹介します。VxGrep は VxEditor に付属しています。開発者のページからダウンロードできます。

VxGrep を愛用しているのは、次の理由からです。

  • pdf、doc、rtf、xls、html、txt、ttx、その他テキストファイルをまとめて検索できる
  • 必要なライブラリ全部入り
  • 正規表現検索が可能
  • 文字コードは自動検出

ひとつの資料フォルダに、全部放り込んで一発検索です。自分の場合、これがなければ翻訳速度は 2/3 ぐらいになるでしょう。また、数百ファイルある翻訳済み TTX や Word ファイルを串刺し検索して、目的のファイルをダブルクリックして開いて修正なんていう素敵なことが、いとも簡単にできます。

好みに合うかどうかはわかりませんが、Grep を使用したことがない人は、一度試してみてはいかがでしょうか。それではこの辺デラウェア。 (火山はキラウェアでした・・・)

6 件のコメント:

  1. ヨシダヒロコ2010年9月25日 14:55

    今の仕事で、SDLX指定だったのにわたしが持っていなかったと言うことでTMを秀丸でGrep検索しています。便利です。

    でもご紹介のエディタ、さらに使えそうですね

    返信削除
  2. TM 案件を秀丸で処理してるんですか、大変ではないですか?

    VxGrep 以外にも色々なものがありますので、自分に合ったものを見つけてください (^^)

    返信削除
  3. ヨシダヒロコ2010年9月25日 17:35

    大変です。何か早い方法をご存知でしたら、教えていただければ幸いです。

    返信削除
  4. 対応できるファイル形式であれば、OmegaT などのフリーの支援ツールを使用した方がよいと思います。

    返信削除
  5. 翻訳フォーラムでは、同様のツールとして Kwic Finder が人気です。

    私は、以下のように使い分けています。

    ・テキストベースで、かつ検索範囲を限定できる場合には秀丸のgrep機能(正規表現も秀丸にいちばん慣れているので)
    ・テキスト以外も検索するときは Kwic
    ・インデックスを使いたい場合は DesktopHE というツール(インデックス作成がけっこう高速でその間の負荷も小さい)

    Vxgrep ちょっと使ってみましたが、いい感じですね。佐川さん、インデックスは使ってますか? もし使っているならその感想もぜひ。

    返信削除
  6. Kwic Finder 知りませんでした。勉強になります。

    DesktopHE は、以前使用してました。速度には問題がなかったのですが、テストでヒットしない文字があって使用を中止したような記憶があります。そのうち、再度試してみたいと思います。

    インデックス化すると早いですよ。ただ、インデックス化すると正規表現を使えません。

    返信削除