IBMは有用なAIの5つの属性を概説しています

数週間前、CTOは、マシン学習モデルの構築に3週間かかったと教えてくれました。 私はわずか3週間でモデルが素晴らしいと聞きました。彼は同意しました。 なぜ長い顔? 11ヶ月後、モデルはまだ棚に座っていました。

そのギャップ 偉大なAIプロトタイプとAIの間の操作は、AIと機械学習が実世界と接触するにつれて共通のテーマになり始めています。 理由は…実際には、多くの理由があり、それらの束を見ることができますが、他のすべての理由の下にある理由は、データがまだ座っておらず、決してないということです。

世界が変わるとデータが変化します。 AIや機械の学習モデルを構築することは、世界を見る方法を構築することを意味します。 しかし、世界とデータが変化するにつれて、モデルは適応するか死ぬ必要があります。 私が会ったCTOは、偉大なモデルを構築することが第一歩に過ぎないことを認識していました。

現実の世界では、それ自身のモデルは脆弱です。 それは実際には流動的なより大きなシステムで生きる必要があります。 ですから、どのようにAIシステムを流動的にするのですか? 5つの属性を念頭に置いて構築します。

1.マネージド

AIや機械学習が真の永続的な仕事をするためには、思慮深く、耐久性があり、透明なインフラが必要です。 まず、データパイプラインを特定し、データの不良または欠落に関する問題を修正することから始めます。 また、モデルの統合されたデータガバナンスとバージョン管理を意味します。 各モデルのバージョン – 同時に数千ものモデルを使用して、入力を示します。 あなたは知りたいと思うでしょうし、規制当局もそうです。

2.弾力性

流動的であるということは、AIモデルが同期しなくなることを最初から受け入れることを意味します。 現実世界で何が変化しているかに応じて、「ドリフト」が迅速にまたはゆっくりと起こることがあります。 回帰テストと同等のデータサイエンスを行い、頻繁にテストを行いますが、時間がかかりません。

これは、モデルに注意が必要であることを知らせるために、正確なしきい値と自動アラートを設定できるシステムを採用しています。 古いデータでモデルを再学習したり、新しいデータを取得したり、最初からフィーチャを再設計する必要がありますか? 答えはデータとモデルによって異なりますが、最初のステップは問題があることを知ることです。

3.演奏者

ほとんどの人工知能は、トレーニング中と導入後の両方で計算上の強さを持っています。 また、ほとんどのモデルでは、詐欺を防止したり、機会を活用したりするために、数分ではなくミリ秒単位でトランザクションをスコアリングする必要があります。 理想的には、GPU上でモデルを訓練し、リアルタイムスコアリングのために十分なメモリとともに高性能CPUにモデルを配置することができます。

もちろん、展開場所にかかわらず、すべてのものを迅速かつエラーフリーに実行することができます。オンデマンド、クラウド、またはマルチクラウド。

4.測定可能

現時点では、AIや機械学習プロジェクトの予算は十分ですが、データサイエンスチームが具体的な成果を出せない場合は、予算がなくなります。 初めから、学習内容とその変化を定量化して視覚化する方法を考えてみましょう。データアクセスとデータ量の向上、モデルの精度の向上、最終的に収益の改善。

データ科学の成果が成熟するにつれて、今測定する必要があるものだけでなく、今後測定したいものについても考えてください。 長期的な目標を追跡するにはシステムの流体は十分ですか?

5.連続

私はデータがまだ座っていないことを指摘し始めました。 流体AIの第5の最終的な側面は、世界が変化するにつれて、継続的に学習することです。 JupyterやZeppelinノートブックのようなツールを使用して、評価のスケジューリングやモデルの再学習のためのプロセスにプラグインできるようにしてください。

同時に、さまざまなアルゴリズム、言語、データセット、およびツールの利点と限界を吸収するにつれて、あなた自身の学習が成長し、進化することを期待してください。 流体AIは、データ、ツール、システムの継続的な改善を要求しますが、作業を行うすべての人にとって継続的な改善も要求します。

データ科学は旅です。 チーズですが、本当です。 これらの5つの属性に注意を払うと、それぞれの瞬間に焦点を当て、未来を明確にするように強制します。

確かに、データは決して座ることはありませんが、あなたは本当に他の方法でそれをしたいですか?

Dinesh Nirmalは、IBMの分析開発担当副社長です。

シェアする

  • このエントリーをはてなブックマークに追加

フォローする