こんにちは、たねやつです。
先日、はてなブログから「生成AIによるサイトクロールの拒否設定」に関する新しい機能のアナウンスがありました。自分のブログのコンテンツを、AIの学習データとして利用されたくない、と考えるクリエイターにとっては重要な選択肢となります。
今回は、この新機能の詳細と設定方法、そして注意点についてまとめました。
この記事でできること
- はてなブログの「生成AIによるクロール拒否」設定がどのようなものか理解できる。
- 具体的な設定方法がわかる。
- この設定の限界や注意点について知ることができる。
「生成AIによるクロール」とは?
まず、「生成AIによるクロール」について、はてなブログの公式説明を見てみましょう。
主に、文章や画像を生成するAI(生成AI)が、モデルの学習や回答生成のためにインターネット上のWebサイトを巡回して情報を収集(クロール)することです。本設定は、ご自身のブログにおけるその情報収集を拒否するためのものです。 (はてなブログ ヘルプより)
つまり、自分のブログ記事がChatGPTなどの学習に使われることを、ブロガー側で「拒否」する意思表示ができる機能、ということです。
設定方法
設定は非常に簡単です。
- はてなブログの管理画面から [設定] > [基本設定] を開きます。
- ページ下部にある「コンテンツ利用設定」の項目を探します。
- 「生成AIによるクロールを拒否する」にチェックを入れます。
- 最後に「変更する」ボタンを押して完了です。
注意点と考察
この設定には、いくつか知っておくべき重要な注意点があります。
1. 必ずしもアクセスをブロックできるわけではない
設定をONにすると、サイトのrobots.txtファイルにAIクローラーを拒否するルールが追記されます。しかし、はてなのヘルプにもある通り、これは絶対的な強制力を持つものではありません。
いいえ、そうとは限りません。robots.txtの指示に従うかどうかは、最終的に各AIサービス側の判断に委ねられています。
これはあくまで「紳士協定」のようなもので、ルールに従うかどうかはAI開発企業側の姿勢に依存します。
2. 対象となるAIクローラー
はてなが現在対象としているのは、OpenAI、Google、Apple、Anthropicなど、主に欧米の主要なAI企業です。
一方で、ByteDance(TikTokの親会社)など、一部の企業のクローラーは現時点では対象リストに含まれていないようです。今後リストが更新される可能性はありますが、すべてのAIクローラーを網羅しているわけではないことを理解しておく必要があります。
私はどうする?
私自身は、生成AIを積極的に活用している立場であり、その技術の発展に貢献したいという思いもあります。また、自分の書いた記事が誰かの役に立ち、新たな知識や創造の種になることにも価値を感じています。
そのため、現時点ではこの設定をOFF(クロールを許可する)のままにしておくことにしました。
最後に
今回は、はてなブログの新機能「生成AIによるクロール拒否設定」について解説しました。
自分のコンテンツをどう扱ってほしいかを意思表示できる、非常に重要な機能だと思います。デフォルトでは「許可」になっているため、この機会にご自身のブログのスタンスに合わせて、一度設定を見直してみてはいかがでしょうか。