たねやつの木

Photographs, Keyboards and Programming

はてなブログで「生成AIによるクロール拒否」設定が可能に。デフォルトは許可状態

こんにちは、たねやつです。

先日、はてなブログから「生成AIによるサイトクロールの拒否設定」に関する新しい機能のアナウンスがありました。自分のブログのコンテンツを、AIの学習データとして利用されたくない、と考えるクリエイターにとっては重要な選択肢となります。

今回は、この新機能の詳細と設定方法、そして注意点についてまとめました。

この記事でできること

  • はてなブログの「生成AIによるクロール拒否」設定がどのようなものか理解できる。
  • 具体的な設定方法がわかる。
  • この設定の限界や注意点について知ることができる。

「生成AIによるクロール」とは?

まず、「生成AIによるクロール」について、はてなブログの公式説明を見てみましょう。

主に、文章や画像を生成するAI(生成AI)が、モデルの学習や回答生成のためにインターネット上のWebサイトを巡回して情報を収集(クロール)することです。本設定は、ご自身のブログにおけるその情報収集を拒否するためのものです。 (はてなブログ ヘルプより)

つまり、自分のブログ記事がChatGPTなどの学習に使われることを、ブロガー側で「拒否」する意思表示ができる機能、ということです。

設定方法

設定は非常に簡単です。

  1. はてなブログの管理画面から [設定] > [基本設定] を開きます。
  2. ページ下部にある「コンテンツ利用設定」の項目を探します。
  3. 生成AIによるクロールを拒否する」にチェックを入れます。
  4. 最後に「変更する」ボタンを押して完了です。
デフォルトの状態では、この設定は**OFF(クロールを許可する)**になっています。拒否したい場合は、必ず手動で設定を変更する必要があります。

注意点と考察

この設定には、いくつか知っておくべき重要な注意点があります。

1. 必ずしもアクセスをブロックできるわけではない

設定をONにすると、サイトのrobots.txtファイルにAIクローラーを拒否するルールが追記されます。しかし、はてなのヘルプにもある通り、これは絶対的な強制力を持つものではありません。

いいえ、そうとは限りません。robots.txtの指示に従うかどうかは、最終的に各AIサービス側の判断に委ねられています。

これはあくまで「紳士協定」のようなもので、ルールに従うかどうかはAI開発企業側の姿勢に依存します。

2. 対象となるAIクローラー

はてなが現在対象としているのは、OpenAI、Google、Apple、Anthropicなど、主に欧米の主要なAI企業です。

一方で、ByteDance(TikTokの親会社)など、一部の企業のクローラーは現時点では対象リストに含まれていないようです。今後リストが更新される可能性はありますが、すべてのAIクローラーを網羅しているわけではないことを理解しておく必要があります。

私はどうする?

私自身は、生成AIを積極的に活用している立場であり、その技術の発展に貢献したいという思いもあります。また、自分の書いた記事が誰かの役に立ち、新たな知識や創造の種になることにも価値を感じています。

そのため、現時点ではこの設定をOFF(クロールを許可する)のままにしておくことにしました。

最後に

今回は、はてなブログの新機能「生成AIによるクロール拒否設定」について解説しました。

自分のコンテンツをどう扱ってほしいかを意思表示できる、非常に重要な機能だと思います。デフォルトでは「許可」になっているため、この機会にご自身のブログのスタンスに合わせて、一度設定を見直してみてはいかがでしょうか。

引用・参考