AIが古代文明の書き言葉を翻訳するのにどのように役立つか
25世紀前、ペルシャのアケメネス朝帝国の「書類」は粘土板に記録されていました。その数万個は1933年にシカゴ大学東洋研究所の考古学者によって現代のイランで発見されました。何十年もの間、研究者はこれらの古代文書を手作業で丹念に研究し、翻訳していましたが、この手動の解読プロセスは非常に難しく、遅く、間違いを起こしやすいです。
1990年代以降、科学者たちは、タブレットの3次元的性質と楔形文字の複雑さにより、限られた成功しか収めずに支援するためにコンピューターを採用してきました。しかし、シカゴ大学での技術革新により、最終的にこれらのタブレットの自動転写が可能になり、アケメネス朝の歴史、社会、言語に関する豊富な情報が明らかになり、考古学者をより高いレベルの分析に解放できる可能性があります。
それが、OIの研究者とUChicagoのコンピューターサイエンス学部の共同研究であるDeepScribeの背後にある動機です。Persepolis Fortification Archiveの 6,000を超える注釈付き画像のトレーニングセットを使用して、Center for Data and Computingが資金を提供するプロジェクトは、コレクション内のまだ分析されていないタブレットを読み込めるモデルを構築し、考古学者が潜在的に使用するツールを作成します古代の執筆の他の研究に適応することができます。
「柔軟性と拡張性があり、さまざまなスクリプトや期間に広がることができ、実際に現場を変えるツールを思い付くことができれば」と、Assyriologyの准教授Susanne Paulusは語った。
コラボレーションは、Paulus、Sandra Schloen、およびOIのMiller ProsserがAsstに会ったときに始まりました。デジタル人文科学に関するノイバウアーコレギウムイベントでのコンピューターサイエンス学科のSanjay Krishnan教授。SchloenとProsserは、OIがサポートするデータベース管理プラットフォームであるOCHREを監督し、考古学的発掘やその他の研究からデータを収集して整理します。クリシュナンは、ビデオやその他の複雑なデータタイプを含むデータ分析にディープラーニングとAI技術を適用します。重複は両側にすぐに明らかになりました。
「コンピュータービジョンの観点から見ると、これらは私たちが直面しているのと同じ課題であるため、非常に興味深いものです。過去5年間のコンピュータービジョンは大幅に改善されました。 」とクリシュナンは言った。「ここでは精度が客観的であるため、これは機械学習の問題です。ラベル付きのトレーニングセットがあり、スクリプトを十分に理解しており、それが役に立ちます。完全に未知の問題ではありません。」
写真は、Persepolis Fortification ArchiveのElamiteタブレットにある楔形の標識の概要を示したホットスポットです。クレジット:the OI
このトレーニングセットは、OIとUChicagoの研究者による80年以上の綿密な研究と、イランに戻る前にタブレットコレクションの高解像度画像(現在60テラバイトを超え、現在も成長中)をデジタル化する最近の取り組みのおかげです。このコレクションを使用して、研究者はタブレットに刻まれたエラム語の辞書を作成し、楔形文字を解読する方法を学ぶ学生は、100,000を超える「ホットスポット」または個々の兆候のデータベースを構築しました。
UChicago Research Computing Centerのリソースを使用して、クリシュナンはこの注釈付きデータセットを使用して、他のコンピュータービジョンプロジェクトで使用されるものと同様の機械学習モデルをトレーニングしました。トレーニングセットに含まれていないタブレットでテストした場合、モデルは約80%の精度で楔形標識を正常に解読できました。進行中の調査では、残りの20%の原因を調べながら、その数値を少しずつ上げようとします。
しかし、80%の精度でさえ、すぐに転写作業に役立ちます。タブレットの多くは、「ウォルマートの領収書の箱」に似た基本的な商取引を説明しています。そして、その判断を完全に立てることができないシステムはまだ有用かもしれません。
「コンピューターが繰り返しの多い部分を翻訳または特定し、それを専門家に任せて、難しい場所名や動詞、または何らかの解釈が必要なものを埋めることができれば、多くの作業が完了します」 OIのコレクションキュレーター。「コンピューターが決定的な決定を下せない場合、確率や上位4位を返すことができれば、専門家が出発点になります。それは素晴らしいことです。」
さらに意欲的に、チームはDeepScribeを他の考古学者と共有できる汎用解読ツールとして想像しています。おそらく、このモデルは、エラマイト以外の楔形言語用に再訓練したり、不完全なタブレットの紛失した部分に書かれたテキストについて教育的な提案をしたりすることができます。機械学習モデルは、タブレットの起源や未知の起源のその他のアーティファクトの特定にも役立つ可能性があります。これは、現在化学テストで対処されています。
CDACが資金を提供した同様のプロジェクトでは、海洋二枚貝の生物多様性の研究や芸術作品のコンテンツからスタイルを切り離すなど、アプリケーションにコンピュータービジョンアプローチを使用しています。デジタル考古学はますます高度な計算アプローチと交差するため、このコラボレーションはOIとコンピューターサイエンス学部との間の将来のパートナーシップを刺激することも期待しています。
「夕食の会話で終わっていたものが実際のコラボレーションになるのに役立ったと思います」とクリシュナンは言いました。「話す以上のことをするようになりました。」
1990年代以降、科学者たちは、タブレットの3次元的性質と楔形文字の複雑さにより、限られた成功しか収めずに支援するためにコンピューターを採用してきました。しかし、シカゴ大学での技術革新により、最終的にこれらのタブレットの自動転写が可能になり、アケメネス朝の歴史、社会、言語に関する豊富な情報が明らかになり、考古学者をより高いレベルの分析に解放できる可能性があります。
それが、OIの研究者とUChicagoのコンピューターサイエンス学部の共同研究であるDeepScribeの背後にある動機です。Persepolis Fortification Archiveの 6,000を超える注釈付き画像のトレーニングセットを使用して、Center for Data and Computingが資金を提供するプロジェクトは、コレクション内のまだ分析されていないタブレットを読み込めるモデルを構築し、考古学者が潜在的に使用するツールを作成します古代の執筆の他の研究に適応することができます。
「柔軟性と拡張性があり、さまざまなスクリプトや期間に広がることができ、実際に現場を変えるツールを思い付くことができれば」と、Assyriologyの准教授Susanne Paulusは語った。
「これは良い機械学習の問題です」
コラボレーションは、Paulus、Sandra Schloen、およびOIのMiller ProsserがAsstに会ったときに始まりました。デジタル人文科学に関するノイバウアーコレギウムイベントでのコンピューターサイエンス学科のSanjay Krishnan教授。SchloenとProsserは、OIがサポートするデータベース管理プラットフォームであるOCHREを監督し、考古学的発掘やその他の研究からデータを収集して整理します。クリシュナンは、ビデオやその他の複雑なデータタイプを含むデータ分析にディープラーニングとAI技術を適用します。重複は両側にすぐに明らかになりました。
「コンピュータービジョンの観点から見ると、これらは私たちが直面しているのと同じ課題であるため、非常に興味深いものです。過去5年間のコンピュータービジョンは大幅に改善されました。 」とクリシュナンは言った。「ここでは精度が客観的であるため、これは機械学習の問題です。ラベル付きのトレーニングセットがあり、スクリプトを十分に理解しており、それが役に立ちます。完全に未知の問題ではありません。」
写真は、Persepolis Fortification ArchiveのElamiteタブレットにある楔形の標識の概要を示したホットスポットです。クレジット:the OI
このトレーニングセットは、OIとUChicagoの研究者による80年以上の綿密な研究と、イランに戻る前にタブレットコレクションの高解像度画像(現在60テラバイトを超え、現在も成長中)をデジタル化する最近の取り組みのおかげです。このコレクションを使用して、研究者はタブレットに刻まれたエラム語の辞書を作成し、楔形文字を解読する方法を学ぶ学生は、100,000を超える「ホットスポット」または個々の兆候のデータベースを構築しました。
UChicago Research Computing Centerのリソースを使用して、クリシュナンはこの注釈付きデータセットを使用して、他のコンピュータービジョンプロジェクトで使用されるものと同様の機械学習モデルをトレーニングしました。トレーニングセットに含まれていないタブレットでテストした場合、モデルは約80%の精度で楔形標識を正常に解読できました。進行中の調査では、残りの20%の原因を調べながら、その数値を少しずつ上げようとします。
大量のデジタルの重荷
しかし、80%の精度でさえ、すぐに転写作業に役立ちます。タブレットの多くは、「ウォルマートの領収書の箱」に似た基本的な商取引を説明しています。そして、その判断を完全に立てることができないシステムはまだ有用かもしれません。
「コンピューターが繰り返しの多い部分を翻訳または特定し、それを専門家に任せて、難しい場所名や動詞、または何らかの解釈が必要なものを埋めることができれば、多くの作業が完了します」 OIのコレクションキュレーター。「コンピューターが決定的な決定を下せない場合、確率や上位4位を返すことができれば、専門家が出発点になります。それは素晴らしいことです。」
さらに意欲的に、チームはDeepScribeを他の考古学者と共有できる汎用解読ツールとして想像しています。おそらく、このモデルは、エラマイト以外の楔形言語用に再訓練したり、不完全なタブレットの紛失した部分に書かれたテキストについて教育的な提案をしたりすることができます。機械学習モデルは、タブレットの起源や未知の起源のその他のアーティファクトの特定にも役立つ可能性があります。これは、現在化学テストで対処されています。
CDACが資金を提供した同様のプロジェクトでは、海洋二枚貝の生物多様性の研究や芸術作品のコンテンツからスタイルを切り離すなど、アプリケーションにコンピュータービジョンアプローチを使用しています。デジタル考古学はますます高度な計算アプローチと交差するため、このコラボレーションはOIとコンピューターサイエンス学部との間の将来のパートナーシップを刺激することも期待しています。
「夕食の会話で終わっていたものが実際のコラボレーションになるのに役立ったと思います」とクリシュナンは言いました。「話す以上のことをするようになりました。」
0 Response to "AIが古代文明の書き言葉を翻訳するのにどのように役立つか"
Post a Comment