langchain-azure-storage¶
langchain_azure_storage.document_loaders ¶
Azure Blob Storage 文档加载器。
AzureBlobStorageLoader ¶
Bases: BaseLoader
用于从 Azure Blob Storage 加载 LangChain 文档对象的文档加载器。
| 方法 | 描述 |
|---|---|
__init__ |
初始化 `AzureBlobStorageLoader`。 |
lazy_load |
从 Azure Blob Storage 延迟加载文档。 |
alazy_load |
异步延迟加载 Azure Blob Storage 中的文档。 |
load |
将数据加载到 `Document` 对象中。 |
aload |
将数据加载到 `Document` 对象中。 |
load_and_split |
加载 `Document` 并将其分割成块。块将作为 `Document` 返回。 |
__init__ ¶
__init__(
account_url: str,
container_name: str,
blob_names: str | Iterable[str] | None = None,
*,
prefix: str | None = None,
credential: _SDK_CREDENTIAL_TYPE = None,
loader_factory: Callable[[str], BaseLoader] | None = None,
)
初始化 `AzureBlobStorageLoader`。
| 参数 | 描述 |
|---|---|
account_url
|
Azure 存储帐户的 URL,例如 `https://
类型: |
container_name
|
存储帐户中要从中检索 Blob 的容器名称
类型: |
blob_names
|
要加载的 Blob 名称列表。如果为 `None`,则将加载所有 Blob。 |
prefix
|
从容器列出 Blob 时用于筛选的前缀。不能与 `blob_names` 一起使用。
类型: |
credential
|
用于向 Azure 存储帐户进行身份验证的凭据。如果为 `None`,将使用 `DefaultAzureCredential`。
类型: |
loader_factory
|
可选的可调用对象,返回一个自定义文档加载器(例如 `UnstructuredLoader`)用于解析下载的 Blob。如果提供,Blob 内容将被下载到一个临时文件,其名称会传递给该可调用对象。如果为 `None`,内容将作为单个包含 UTF-8 文本的 `Document` 返回。
类型: |
alazy_load async ¶
alazy_load() -> AsyncIterator[Document]
异步延迟加载 Azure Blob Storage 中的文档。
| YIELDS | 描述 |
|---|---|
AsyncIterator[Document]
|
`Document` 对象。 |
load_and_split ¶
load_and_split(text_splitter: TextSplitter | None = None) -> list[Document]
加载 `Document` 并将其分割成块。块将作为 `Document` 返回。
危险
不要重写此方法。应将其视为已弃用!
| 参数 | 描述 |
|---|---|
text_splitter
|
用于分割文档的 `TextSplitter` 实例。默认为 `RecursiveCharacterTextSplitter`。
TYPE: |
| 引发 | 描述 |
|---|---|
ImportError
|
如果 `langchain-text-splitters` 未安装且未提供 `text_splitter`。 |
| 返回 | 描述 |
|---|---|
list[Document]
|
`Document` 列表。 |