ふたたびまどろみのなかで

原口昇平のブログ

言語キャピタリズムから言語コミュニズムへ――言語はコミュニテイの共有財産であり、大規模言語モデル(LLM)の私有化はコミュニティに対する越権である

産業翻訳に従事する言語労働者たち。私たちほど、何十年もにわたり互いの顔も見えないほど分断され孤立している労働者のタイプが、他にあるだろうか?

私たちの存在はふだん表に見えない。ただ、クライアントや翻訳会社が所有する「翻訳メモリ」(原文と訳文をペアで格納しているデータベース)の中に、訳文の作成者や更新者として記録されているだけだ。

それでも私たちは、輸出入されるあらゆる商品やサービスの広告からマニュアルまでにかかわり、また国境をまたいで活動しようとする組織や企業を言葉でつなぎ、グローバル資本主義の構造的な搾取に多かれ少なかれ加担する一方で私たち自身も搾取されながら、外国語を読めない人にも理解できる言葉で商品やサービスを利用できるよう助けてきた。

私たちを抜きにしては、例えばITの普及はありえなかった。私たちが力を貸さなければ、ラグジュアリーブランドが現地の販売者と手を切ってウェブサイトの現地語版を公開し、自分たちで高級商品を販売することによりそれまで以上に大きな利益をあげるようになることもなかった。私たちがいなければ、旧ツイッター日本語版の各種ポリシーも日本語で読めるようになりはせず、まして日本語UIも使えはしなかった。

さまざまな問題を引き起こしながらも発展を続ける今日のグローバル経済は、私たちあってのものなのだ。はじめに私たちがあったとはいわないが、私たちは確かに、デジタルによって加速したグローバル経済の中を流通するあらゆる言葉とともに常にあった。

にもかかわらず、私たちが手掛けた訳文は、新しいプロジェクトやAIの機械学習に使い回され、私たちはそのたびに一銭も受け取ることがない。翻訳メモリが言語資産と呼ばれ、仮に売り買いされていたとしても私たちに知らされることは少しもない。しかも、単価に下向きの圧力をかけるために私たちの間で競争を続けさせようと仕向けられていて、新規参入者にとって過剰に厳しい言説を振りまくほどに追い込まれている。

グローバルな資本主義の中で、プラットフォームを通じてデータを収集し一手に掌握する者たちは、私たちが築き上げたにもかかわらず私たちが所有することを許されていない言語資産を利用し、私たちの言語労働の一部または全部を機械に置き換えようとしたり、生産手段を持たず自らの言語運用能力を労働力商品として販売するほかない私たちに対してさらなる値下げを迫ったりしている。こうして私たちはあまりにも隠され、軽んじられ、無視され、そう遠くない将来に無くなる職業ランキングの上位に位置づけられている。

このようなことがまかりとおっているのは、私たち言語労働者が他分野では類を見ないほどばらばらに分断され、ひたすらに競争させられ続けているからだ。

私たちは、手をつながなければならない。私たちが本来受け取るはずだったものを、彼らから取り戻すために。

機械翻訳は、私たち翻訳者が主体となり、私たち自身が手掛けたデータに基づいて構築し、私たち自身が所有し、私たち自身のために使用不使用を決めるべきだ。

クライアントや翻訳会社が主体となるのも、他人の翻訳物をかすめとるのも、大企業に所有されるのも、単価引き下げのため使用されるのもダメだ。

問題の核心は、重要な言語資産である翻訳メモリが、私たちにより築かれていながら大資本により所有されていること。これは、本来翻訳者コミュニティのものであるはずのものを私利のために取り上げているに等しい。ならば私たちは、翻訳者・翻訳校閲者・言語品質管理者の労働者協同組合を結成し、組合員全員が出資、労働、意見をし、コミュニティ内部だけで翻訳メモリやエンジンを構築・共有してはどうか?

方法は問わない。ともかく言語キャピタリズムの奴隷であることはもうやめて、言語コミュニズムへシフトしよう。