私は分析、データ科学、統計を長年にわたって行ってきましたが、アナリティクスが単に「数学」と呼ばれたときを思い出します。私は今年RSAカンファレンスの展示フロアを歩きました。私は全体を謝罪したいと思います 分析業界では、そこにあるすべてのノイズを対象としています。 AIやアナリティクスが多くの業界、特にサイバーセキュリティ業界に革命をもたらしていることは間違いありません。 しかし、実際に数学が達成できるものには限界があるため、それは銀色の弾丸ではありません。 あなたが騒音をナビゲートするのに役立つことを期待して、3つを見てみましょう。
1.すべてを統治するアルゴリズムはありません
すべての場合に機能する単一のアルゴリズムなどはありません。 いくつかのアルゴリズムが素晴らしく、新しくてエキサイティングなことは事実ですが、単一のアルゴリズムに焦点を当てたソリューションには注意が必要です。 最近の例は深い学習です。 ディープ・ラーニングは合法的に刺激的なテクニックであり、私はその潜在能力のファンです。でも、それがすべてにとって正しいアルゴリズムであるということを意味するわけではありません。
ディープラーニングは、ラベルやサンプルに依存する、接続されたプロセスの大規模で階層化されたコレクションを使用して学習する機械学習アルゴリズムのクラスです。 未来の道として告げられた 。 しかし、驚くほど深いニューラルネットワークを欺くのは簡単です。 それは確かに銀色の弾丸ではありませんが、実際には数学的分析に銀色の弾丸がないということです。 ディープ・ラーニングやAI技法は、あらゆるユース・ケースでは機能しません。 各手法の長所と短所を理解し、問題に適したツールを選択することが重要です。 すべての爪のハンマーのように見えるようにしようとする流行語やマーケティングスピンに気を取らないでください。 ハンマー、マレット、スレッジハンマーの違いと同じように、アルゴリズム間には大きな違いがあります。
たとえば、ディープラーニングはマルウェアの検出に優れています。その主な理由は、数十年にわたるマルウェアバイナリという膨大なラベルのデータセットが含まれているためです。 ほとんどの主要なウイルス対策およびアンチマルウェアベンダーは、具体的な目的のために深い学習を使用することを奨励しています。 しかし、あなたの問題がマルウェアではない場合、深い学習はあまり効果的ではありません。 例えば、インサイダーの脅威の検出に関しては、深い学習は驚くほど短くなります。 インサイダーの脅威シナリオでは、通常、限られた、無差別なデータセットが扱われます。深い学習では、これを効果的に理解できません。 槌でコンクリートを壊したり、壁に額縁をぶら下げたりすることを想像してみてください。 適切なツールを使用すると、結果が不十分または悪くなる可能性があります。
最終的には、単一のアルゴリズムに重点を置くベンダーには懐疑的であることが賢明です。解決しようとしている問題を定義するのは良い方法ではありません。
2.数学はそれまでに見たことのない何かを将来予測することはできない
予測分析は、既存の情報から推論するモデルに依存します。 これは 人間の脳に似ている 観察と経験によって学ぶ。 あなたが以前に何かを経験したことがないなら、あなたは何を期待するか分からない。 せいぜい、新しいものと前例のないものが起こっていることを認識するかもしれませんが、本当に斬新なものは、あなたが予測していたものとは考えにくいものです。
同様に、数学はこれまでに見たことのないものは予測できません。 たとえば、数学では、Spectreのような投機的実行サイドチャネル攻撃は初めて発生しました。 数学は、今何を探すべきかを知っており、次の出来事を予測できるモデルを潜在的に作成することができるので、数学はこれを予測することが可能です。 これは、トランスクリプトの最初のインスタンスにも当てはまります。 最高でも、異常検出モデルでは異常な動作が検出され、セキュリティチームに不思議な不具合があることが警告されました。 しかし、特定の問題を特定していない。
この制限は、ゼロデイ攻撃の予測が不可能ではないことに注意してください。 ほぼすべてのゼロ日がこれまでに見られたテーマのバリエーションであり、この過去の経験が予測可能になるため、これを行うことができます。
3.数学はあなたの心を読むことができません
数学はあなたの心を読んだり、データにないものを推論することはできません。 結局のところ、数学はあなたがそれを養うデータと同じくらい良いです。 頭の中やチームの頭の中に結果を改善するビジネスコンテキストがある場合、それは提供および統合する必要があるデータセットです。 たとえば、行動分析システムが中国からVPN-edを受けた従業員のアカウントを検出し、異常に大量のデータを取得し、以前にアクセスしたことがないファイル共有にアクセスすると、数学はセットに関する正当な理由を指摘しています 行動の しかし、もしこの従業員が中国で休暇を取って仕事の役割を変え、新しいプロジェクトファイルをダウンロードしていることが誤っているとすれば、数学者がアクセスを得ることなくそれを理解する方法はありません HRデータベースに、休暇および職務役割情報を提供する。 正しいデータがなければ、世界で最高の数学は無関係です。より包括的なデータでサイバーセキュリティマシンの学習アルゴリズムを養うことができれば、より優れた知性を提供することができます。
数学で何ができないのかを理解して、できることを利用できるようにすることが重要です。
数学は魔法ですが、魔法ではありません。
Stephan Jouは Interset 。