Genrative AI Use case でナレッジベースに読み込ませるBedrockのPDFファイルがus-east-1リージョンに作られてしまった件。
これは、手順で言うところの4-6にあるBootstrapが原因のようです
Generative AI Use Cases JP (GenU)を使ってRAGを体験してみよう(KnowledgeBases編)
https://dev.classmethod.jp/articles/generative-ai-use-cases-jp-handson-kb-rag
SageMakerStudioでコードを見ていると、DEPLOY_OPTION.mdの220行目あたりに
```bash
# 以下はBootstrap するコマンドの例 (modelRegion が us-east-1 だとした場合)
npx -w packages/cdk cdk bootstrap --region us-east-1
```
デプロイ時に `/packages/cdk/rag-docs/docs` に保存されているデータが、自動で Knowledge Base データソース用の S3 バケットにアップロードされます。(ただし `logs` から始まる名前のファイルは同期されませんので注意してください。) デプロイ完了後、以下の手順で Knowledge Base の Data source を Sync してください。
と書かれていました。
Bootstrapとは?
手順で出てきた
CDK を利用したことがない場合、初回のみ Bootstrap 作業が必要です。すでに Bootstrap された環境では以下のコマンドは不要です
って言葉を何も考えずに実行したのですが、そもそもBootstrapがわかりません
AWS CDK ブートストラップ
https://docs.aws.amazon.com/ja_jp/cdk/v2/guide/bootstrapping.html
こちらを見ると、CDKで環境を構築するための前準備として、構築に必要となるリソースをあらかじめプロビジョニングする行為のようですね。
説明を見る限り、S3にLambdaコードを置いたり、ECRへイメージを登録したりと。するようだ・・・が、肝心のS3にPDFをどうやって保存しているのかがいまいちよくわからなかった。
このあたりはCDKの基本も何も抑えていないので、地道に見ていくしかないかもしれない。。。