より有用なコンピュータビジョンを構築するための3つのステップ

「コンピュータビジョン」は確かにSFの概念なので、スマートデバイスがすべてを見ているツールになるという考えが多くの想像力を捉えていることは驚くことではありません。 しかし、テクノロジーの真の可能性は、偉大なアプリケーションがどのように見えるかについての広範な誤解によって後退し、 彼らが達成できるもの

コンピュータビジョンは、競争上の優位性や革新のためのプラットフォームを提供することができますが、それは魔法の弾丸ではありません。 特定の問題のためにその価値を評価するために不可欠なステップは、既にそこにあるものを理解することから始まります。テクノロジーが本当にできることについての先入観に挑戦するアプリケーションの範囲。 その洞察で、コンピュータビジョンが解決しなければならない他の種類の重要な顧客問題を特定することができます。 潜在力を現実に変えることは、システムを教え、そのアウトプットが有用であることを保証するために不可欠なインフラストラクチャとデータ要件の問題です。

始めから

コンピュータビジョンはどこから来たのですか? これは安価で高品質なカメラの普及によるもので、公共、民間、商業分野で撮影された画像の範囲が拡大しています。 同時に、機械学習と深い学習技術の進歩により、これらの画像をデジタル信号に変換し、一連の動作をサポートしています。 まず、これらの目視検査タスクには、在庫レベルの追跡や生産ラインの監視が含まれていました。 これらのシンプルで日常的な活動を自動化することで、人々はより複雑な思考が必要な仕事を自由にすることができました。 しかし、未来は技術者ができることにほかならない。

より有用なコンピュータビジョン技術を構築するために我々が取らなければならない3つのステップがここにあります。

1.詳細、縮尺、時空に焦点を合わせる

これらのオートメーション機能は引き続き有用ですが、新しいアルゴリズムは、コンピュータビジョンを人間の目よりも多様かつ適応性があると考えるチャンスを与えてくれます。 視覚を解釈してパースする脳の能力によってバックアップされた視覚の明瞭さを高めることは、現時点では複雑すぎる問題に取り組む能力を高めることができます。

突如として、技術の潜在力は大きく分けて3つの重要な領域に拡大されています。知覚できないものを見て、規模で見て、時間と空間を見ます。

  • 知覚できないものを見る 私たちの脳だけで可能になるほどのことを見て解釈することです。 MITの研究者が取り組んでいる 人の脈を検出する 人の顔の標準的なビデオ映像から。 コンピュータビジョンは、皮膚の色調や色の微妙な変化を測定し、その信号によって、人に近づかずに脈拍を得ることができます。 ユーザーはこの信号を適用して、ビデオ画像をリアルタイムでゆがめて文字通りパルスを見えるようにすることができます。 これは、ヘルスケアにおける周囲の感知、モニタリング、および診断のための大きな可能性を秘めています。
  • スケールで見る 膨大な量のビジュアルコンテンツを監視し処理する能力です。 削除されたコンテンツを検査している人々は、今日のソーシャルメディアモデレーションを担当していますが、このアプローチは反応的であり、規模が非常に限られています。 また、それらの司会者は心理的ストレスの危険にさらされます。 最近のプロジェクトでは、フィヨルドで、コンピュータビジョンを使用して人々が人と人工知能の両方を含むようにモデレーションチームを再設計することで、人々がソーシャルメディア上のビデオコンテンツをモデレートできるように支援しました。 コンピュータビジョンは、明らかなコンテンツ違反を検出して対応するとともに、人間の審査を必要とするコンテンツを豊かにし、事前に編集し、レビューされるコンテンツの量を増やし、厄介なコンテンツへのエクスポージャーを制限することができることを発見しました。
  • 時間と空間を見渡す フッテージをキャプチャし、それ以外の方法では不可能な機能を観察することができます。 野生生物の生態学的調査は、通常、莫大な費用がかかり、完了するのに時間がかかり、困難です。 コンピュータのビジョンは、実務者が 地図の森林破壊 航空写真および衛星画像を使用したバイオマス削減が含まれる。 リモートカメラのトラップも役立ちます 野生生物集団を数える 非常に孤立した場所にあります。 業界では、 再建株式会社 自律的に撮影された映像と建物情報管理システムを組み合わせることで、大規模な建物の現場での進捗状況を監視できます。 洞察は、自動的に進捗計画を生成し、建設プロセスまたは設計における偏差または不規則性を検出することができます。

2.データをサイズアップする

これらの例が示していることは、テクノロジーが実際どれだけ広く、成熟しているかです。 しかしこれは、それが機能するために必要な膨大な量のデータのために、他のセクターや小規模なビジネスよりもむしろ大きな技術の機会のように感じられるかもしれません。 データはコンピュータビジョンアルゴリズムに役立つ燃料です。ソーシャルメディアとウェブプラットフォームの巨人は、コンピュータビジョンの訓練には自然な利点があります。

しかし、これによって他人の行動が妨げられてはなりません。

多くの組織では、すでに所有しているイメージデータを活用できません。 例えば、小売業者は、CCTV映像の大部分に座っており、通常はセキュリティ事件の後にしか検査しない。 その映像にコンピュータビジョンを適用すると、チェックアウト時に待ち行列が構築され始め、顧客が店内で迷子になっているかどうかを確認したり、見つからない子供を検出したり、店舗レイアウトの再設計を知らせることができます。

企業が既存のイメージデータの利点を持たない場合、ユーザーが作成したコンテンツを試し始めることができます。 Googleのクイックドローは、あなたの携帯電話で何をスケッチしているのかを推測しようとする、ゲームのような体験です。 わずか数ヶ月で、プログラムが生成されました 5千万の落書き Googleは人々の手書きのひらめきを自動的に解釈できるようになりました。

オンラインファッション小売業のAsosは、 私に見られるように ユーザーに自分自身のファッション写真をアップロードするよう促します。 当初の動機は顧客関与と忠誠心でしたが、コンピュータビジョンを通じた大量パーソナライゼーションの可能性は明らかです。

これらの移行データ生成サービスは、コンピュータビジョンを利用した製品戦略において重要な役割を果たす重要なツールです。 たとえば、Googleはクイックドローの知識ベースをツールに変えました それは解釈し、強化する あなたの手描きの手書きをリアルタイムで表示します。

既存またはユーザー生成のデータがなくても、製品やサービスにコンピュータビジョンを追加できる既製のソリューションが利用可能です。

3.顧客を写真に入れる

データポイントは顧客を優先させる必要性を再強要するだけです。 ユーザーが企業のデータ使用方法を以前よりも心配している時には、コンピュータビジョンのような強力な新技術を、目的の明確な意味がなくては実装できません。

その答えは、まず人間のニーズを掘り下げ、ユーザーを助ける技術の可能性を十分に理解したサービス設計の原則を適用することです。 新しいデジタルツールを人々の生活の中に導入するためのコンテキストを提供するために、痛みポイント、行動パターン、満たされていないニーズを特定し調査するための設計研究から始まります。

このアプローチの応用は、コンピュータビジョンを 庭師が花を識別するのを助ける 、住宅所有者に 昼光の影響を想像してください 、そして私たちのすべてを助けるために 暗闇の中をナビゲートする 。 コンピュータビジョンは真のエキサイティングな技術であり、私たちはデジタル製品とサービスの潜在的可能性を発見し始めたばかりです。

だから、あなたのビジョンは何ですか?

Connor Uptonは、 フィヨルド、デザイン&イノベーション アクセンチュアインタラクティブから。

シェアする

  • このエントリーをはてなブックマークに追加

フォローする