Google には、人工知能による画像の作成に関しては大きな実績がありません。新たにスキャンダルが勃発したジェミニに組み込まれている画像ジェネレーターが、人々の画像を誤って作成し、人種を間違えたためです。多くの苦情の後、ハイテク巨人は顔生成機能を削除し、「修理に」送りました。私たちが待っている間に、同社は Vertex AI 開発者プラットフォームの一部として改良された Imagen 2 イメージングツールをリリースしました。ただし、微妙な点があります。このツールは依然としてビジネスに焦点を当てています。

Imagen 2 は、DALL-E や Midjourney と同様に、テキストプロンプトを使用して画像を作成および編集できます。このツールはテキスト、エンブレム、ロゴを複数の言語で表示でき、オプションでこれらの要素を名刺、衣服、製品などの既存の画像にオーバーレイできます。

最初にプレビューモードで起動した後、Imagen 2 によるイメージ編集が Vertex AI で利用できるようになり、ペイントとカラーというつの新機能が追加されました。 DALL-E などの他の一般的な画像ジェネレーターによって長い間提供されてきたペイント機能とカラーリング機能を使用して、画像の不要な部分を削除し、新しいコンポーネントを追加し、画像の境界を拡張して、より幅広い領域を作成できます。ビュー。

しかし、Imagen 2 の本当のアップグレードは次のとおりです。でログイン「テキストのライブ画像への変換」と呼ばれます。このツールは、AI を活用したクリップメーカーと同様に、テキストプロンプトから 4 秒のビデオを作成できるようになりました。モデルの企業の焦点に沿って、Google はマーケティング担当者やクリエイティブ向けのツールとして、自然、食べ物、動物を紹介する広告用の GIF ジェネレーターなどのライブ画像を提供しています。これは Imagen 2 が完璧に訓練されている主題です。

でログインライブ画像は「一貫性を維持しながら」「さまざまな角度や動き」を捉えることができると主張している。しかし今のところ、解像度は 360x640 と低く、同社はこれが将来的に改善されることを約束しました。

Googleは、ディープフェイクの可能性についての懸念を軽減するために、Imagen 2はGoogle DeepMindが開発した特別なSynthID技術を使用して、ライブ画像に目に見えない暗号透かしを適用すると述べた。これらは、圧縮、フィルター、色調調整などの編集には耐性がありますが、それらを検出するには別のツールが必要です。

またでログインライブ画像の生成は「セキュリティ目的でテストされる」と強調している。「Vertex AI の Imagen 2 モデルでは、Gemini アプリケーションと同じ問題は発生しませんでした。私たちは引き続き積極的にテストし、顧客と対話していきます」と同社の代表者は述べています。

また読む：

ソースTechCrunchの

サインアップ

0 コメント

埋め込まれたレビュー

すべてのコメントを表示

その他の記事

GoogleのAIツールImagen 2が4秒の動画を作成できるようになった

最近のコメント