人工知能は顔、食料品、さらには顔を検出することができます 潜在的に有毒 きのこ。 それではなぜ歴史的な落書きはありませんか?
プレプリントサーバーArxiv.org( ” 歴史的グラフィティの自動認識のためのオープンソースデータセットと機械学習技術 “)、国立テクニカル大学ウクライナと恵州大学情報科学研究科の研究者は、キエフ大聖堂の石の壁に刻まれた古代の文字を検出し、分離し、分類する機械学習モデルを記述している。
“一般的に、前処理にはグリフ全体についての事前知識が必要ですが、現時点ではオープンソースデータベースとして[特定の]データセットは利用できません… “チームは書いた。 “この論文の主な目的は、歴史的なグラフィティを自動認識するためのいくつかの機械学習技術を適用し、複雑な幾何学的形状、ほとんど認識できない形状、低い統計的表現性の観点から効率を評価することです。
彼らは、東スラヴのビジュアルテキストで一般的に使用されている2つのアルファベットであるGlagoliticとCyrillicに、その努力の大部分を集中させました。 考古学者は、ウクライナの聖ソフィア大聖堂で、11世紀にさかのぼるものの両方からのグリフを発見しました。 現在までに、約7,000人が検出され、研究されている。
言うまでもなく、過去のレターデータセットは、アラビア語アルファベットのデータセットほど一般的ではないため、チームは4つの文字タイプの4,000以上のイメージを集めて前処理しました。 彼らはnotMINSTを使用しました。これは、2つの出力を比較するために、公に利用可能なフォントと文字A〜Jのグリフを含む2番目のデータベースです。
彼らは次に、notMINSTとその斬新なデータセットからデータを供給してグラフィティを認識するために、コンピュータビジョンで一般的に使用される機械学習アルゴリズムの一種である畳み込みニューラルネットワークのトレーニングに着手し、 画像を防ぐために オーバーフィット 。
ニューラルネットは、それぞれ、ミーンズではなく、チームのデータセットから文字を分離する際に99パーセント正確であった。
将来、研究者は、モデル、言語、原作者、真偽、意味などの要素を考慮してモデルを改善することを望んでいます。 さらに、「オープンサイエンス、ボランティアのデータ収集、処理、コンピューティング」の精神で、世界中で共有される大規模なデータセットの作成を提案しており、さらなる進歩をもたらすであろうと述べています。
“[G]ラフィティは非常に強力な歴史知識の源です。 サファイア語の唯一の知られている情報源は、シリア南部、ヨルダン東部、サウジアラビア北部の岩の表層にある落書き碑文です。 「コンピュータビジョンと機械学習の最近の進歩により、現在の認識、識別、ローカリゼーション、セマンティックセグメンテーション、さまざまな起源の歴史的なグラフィティの解釈を改善するためにそれらを適用することができます…」