AmazonのMatt WoodがAWS Summit 2018の主要なテイクアウェイで

水曜日、Googleのクラウドネクストカンファレンスよりわずか数日前、アマゾンはAmazon Web Servicesクラウドコンピューティング会議AWS Summitをニューヨーク市のJacob K. Javitsコンベンションセンターで開催した。 それは後退しなかった。

シアトルのフルスタックマシン学習プラットフォームであるSageMakerは、SageMaker Streaming AlgorithmsとSageMaker Batch Transformという2つの主要なアップデートを見た。 前者は、Googleで作成したニューラルネットワークモデルで使用できます TensorFlow 顧客は、AWSのSimple Storage Service(S3)からSageMaker GPUおよびCPUインスタンスにデータを直接ストリームすることができます。 後者の場合、APIコールを使用して大規模なトレーニングデータセットを分割する必要はありません。

ハードウェアの面では、AmazonはElastic Compute Cloud(EC2)を スノーボールエッジ システム、オンプレミスのIntel Xeonベースのデータ処理および収集用プラットフォームです。 また、ローカルストレージ、コンピューティング、データキャッシング、マシン学習の推論機能を強化しました。 AWSグリーングラス AWSラムダ 、およびAmazon S3をサポートし、新しいカテゴリーの仮想化アプリケーションを、限られた接続性を持つ作業環境でリモートで実行できるようにします。

サービスの面では、Amazon Transcribeの新しいChannel Synthesisツールは、複数のチャンネルからのコールセンターのオーディオを1つのトランスクリプションにマージし、Amazon、Translateは日本語、ロシア語、イタリア語、繁体字中国語、トルコ語、チェコ語をサポートします。 最後に、アマゾンの自然言語処理サービス(NLP)であるAmazon Comprehendは、シンタックス識別のおかげでテキスト分析の改善を誇っています。

そして、Amazonは主要な顧客との新たな拡張パートナーシップの数を明らかにした。 Fortnite開発者 すごいゲーム AWS上で「新しいゲームと経験」を構築していると言いました。 21世紀フォックス オンデマンドコンテンツ配信の「大多数」にAmazonのクラウドサービスを使用します。 メジャーリーグ そして 式1 リアルタイムのデータ分析のためにAWSのAIツールを活用する予定です。 そして セレニネ Amazonの機械学習プラットフォームを活用して、薬物分析と検証を迅速化します。

今週の発表の周りの少しの文脈については、AmazonのAWSの人工知能担当ゼネラルマネージャであるMatt Wood博士と話をし、Amazonのクラウドコンピューティングの勢い、AIの大まかな動向、 機械学習モデルとデータセットの偏りの問題。

私たちのインタビューの写しは、長さと明快さのために編集されています。

VentureBeat:今日、SageMaker Streaming Algorithmsを発表しました。このアルゴリズムにより、AWSのお客様は機械学習モデルをより迅速に学習できます。 動機は何でしたか? 顧客が深い欲求を表明したものでしたか?

マット・ウッド: AWSには投資したいことがいくつかありますが、それは時間の経過とともに変化しないと考えられるものです。 私たちは、1年、10年、または50年ではなく100年 – 私はそれを担当し、それを担当することを超えて、ビジネスを構築しています。 あなたがその長期的な見方をするとき、あなたは変わると思うものにではなく、あなたが同じとどまると思うものにお金を入れる傾向があります。

インフラストラクチャとAWSのために – これはマシンラーニングにも当てはまります – 費用は本当にその大きな要因です…顧客がサービスをより高価にしたいと言っていると想像することは不可能です。 コストを削減する私たちの道。

本当に良い例は、数年前に発表したことです トラステッド・アドバイザー 。 Trusted Advisorは、AWSアカウント内でオンにできる機能です。何もすることなく、自動的にAWS請求を減らす方法についての推奨事項が作成されます。 私たちは、顧客にそのように年間3億ドルを節約しました。

これらはクラウドが提供するいくつかの利点であり、我々が維持したいと考える利点です。

VentureBeat:クライアント側では、Epic、Major League Baseballなどと戦略的パートナーシップを発表しました。そのほとんどはAWSを独自のクラウドプラットフォームとして使用すると言いました。 では、そこには何がありますか? これまでのフィードバックは何ですか?

木材: スポーツ分析には多くの用途があります。 フォーミュラ1はマシン学習プラットフォームとしてAWSを選択し、メジャーリーグはマシン学習プラットフォームとしてAWSを選択し、ナショナルフットボールリーグはマシン学習プラットフォームとしてAWSを選択しました。 その理由は、視聴者にとってより良いエクスペリエンスを欲しがり、マシンの学習が、ルート予測や統計予測など、プロダクション環境にもたらしたい先進的な次世代統計の重要な要素であると考えているからです。

それはちょうど1つの大きなエリアです。 その他の分野は医薬品とヘルスケアです。 私たちはHIPAAに準拠しているため、[私たちの]顧客は医療業務に取り組むことができるため、病気の予測に大きな勢いを持っています。 私たちは、糖尿病性網膜症の予測、再開の予測 – すべてのそれらの種類のものを行います。

そのために、[今週は] Bristol Myers SquibbがSageMakerを使用しています 彼らが構築する革新的な医学の発展を加速させるためです。 Celgeneは本当に良い例です – Celgeneは実際に動作します グルーン これはSagemakerの上にある私たちのマシンラーニングライブラリであり、Nvidia VoltaのP3 GPUをフードの下で利用しています。 だから、あなたが知っているのは、薬をより迅速かつ安全に市場に出せるようにする能力を大幅に加速させた、本当に良い例です。

VentureBeat:Amazonは、多くの機械学習サービスを開発者に提供しています。 認識 – あなたのコンピュータビジョンプラットフォーム – そしてAmazon翻訳。 しかし、あなたはGoogle、Microsoftなどのスペースで多くの競争を抱えています。 では、どうやって残りの部分からAPIとサービスを区別していますか?

木材: 確かに、私たちは競合他社が何をしているかについて少しでも時間を費やすことはありません。 私たちは100の新しいサービスと機能を開始しました。 Reinvent 2017 他のプロバイダはその半分以上を行っていません。 私たちが立ち上げたものの90〜95%が顧客からのフィードバックによって直接的に推進されたと言いますが、他の5〜10%はライン間を読んで、顧客があまり知らないもの 何を求めているのか。

SageMakerは、顧客が価値を差別化していると信じているデータを持っている場合に本当に役立ちます。 次に、利用可能なトレーニングデータが多くないか、アプリケーションにあるレベルのインテリジェンスをすばやく追加したいアプリケーション開発者がいます。これは、認知度、認知度ビデオ、転記、理解度、 ポリリー 、Lex、およびTranslateが入ってきます。

私たちはこれについて冗談を言っていますが、私たちのより広範な使命は、実際にはマシンを学ぶことを退屈なものにして、まったくバニラにすることです。 以前は数百万ドルもの膨大な投資を必要としていました。 それは完全に手の届かないものでした。私は非常に短い時間で大きな進歩を遂げたと思います。

私たちはアマゾンで言う:それはまだインターネットのための一日です。 機械学習のために、目を覚ますことさえなく、最初のコーヒーカップがまだありませんでした。 しかし、興奮と勢いのトンがあります。 私たちには、数万人のアクティブな開発者がプラットフォーム上にあり、250%の成長率があります。 AWS上で稼働する10台のマシン学習ワークロードのうち8台が、他のプロバイダの2倍の数です。 そして顧客は、継続的なプラットフォームの改善に重点を置いています。 私たちがどこに向かっているのか、とても興奮しています。

VentureBeat:特に、音声認識と自然言語処理は現在非常に競争の激しい領域です。 競争相手が何をしているかについてあまり考えないと言ったのは知っていますが、市場に対してどのような利益をもたらしましたか?

木材: これらのサービスは素晴らしいスタートを切っており、コンタクトセンターは本当に大きなエリアになっています。

多くのお客様が使用しています Amazon Lex 彼らの最初の接触点として。 ザ 英国の国民保健サービス(NHS)は、 どこでLexのチャットボットを導入し、彼らは通話量の40%を処理することができました。 これは英国全土の集中化された保健医療提供者であり、誰かとより迅速に話をする患者の面では本当に意味があり、NHSはコンタクトセンターをより効率的に運用することができます。

[今週]私たちは、2人が同じファイルにコール・センター・レコーディング(エージェントと顧客の1つの録音)を取って、チャネルを分割し、それらを独立して転記することができたChannel Splittingを発表しました。 トランスクリプトを一緒にマージします。 あなたは一つのファイルを取り出し、それを取ることができ、それをComprehendに渡して、会話の中で何が起こっているのか、人々が何を話しているのかを知ることができます。 また、コンプライアンスチェックを実行して、コンタクトセンターの担当者が正確にスクリプトを発言しているかどうかを確認することもできます。

効率性の観点からは、大規模なコンタクトセンターは高価で、ほとんどの組織では実行が難しく、Lexから管理、コンプライアンス、分析、データへの洞察に至るまで、AWSの使用例 。

VentureBeat:シフトギアは少しです。 あなたは少し前にインクルージョンについて言及しましたが、おそらくあなたが知っているように、コンピュータビジョンに関しては、 顔認識は特に難しいことです 開発者とインフラストラクチャプロバイダが正しくなるようにします。 だからあなたはそれがどのように取り組まれていると思いますか? これらのアルゴリズムをどのように改善できますか?例えば、 色の人々に偏っているように見える 特定の民族と人種がありますか?

木材: ゴミの古典的な例ですが、ゴミは出ています。 あなたのデータをどこから得るべきかを本当に慎重に考えていない場合や、間違った意図を持って完璧な代表セットのデータにいくつかの選択基準を導入した場合は、不正確さを導入することになります。 良いことは、機械学習では、それらの不正確さを特定し、測定し、体系的に減らすことができることです。

SageMakerのような当社のサービスの主な利点の1つは、モデルを訓練して保持することが早ければ早いほど正確な領域を特定し、不正確さを絞り込むことができることです。 その点でSageMaker Streaming Algorithmsのような私たちの投資は、そのフライホイールをより速く回転させることに貢献し、開発者はデータ内のノイズのいくつかを克服するより洗練されたモデルを繰り返して構築することができます。

シェアする

  • このエントリーをはてなブックマークに追加

フォローする