跳转到内容

langchain-azure-storage

PyPI - Version PyPI - License PyPI - Downloads

langchain_azure_storage.document_loaders

Azure Blob Storage 文档加载器。

AzureBlobStorageLoader

Bases: BaseLoader

用于从 Azure Blob Storage 加载 LangChain 文档对象的文档加载器。

方法 描述
__init__

初始化 `AzureBlobStorageLoader`。

lazy_load

从 Azure Blob Storage 延迟加载文档。

alazy_load

异步延迟加载 Azure Blob Storage 中的文档。

load

将数据加载到 `Document` 对象中。

aload

将数据加载到 `Document` 对象中。

load_and_split

加载 `Document` 并将其分割成块。块将作为 `Document` 返回。

__init__

__init__(
    account_url: str,
    container_name: str,
    blob_names: str | Iterable[str] | None = None,
    *,
    prefix: str | None = None,
    credential: _SDK_CREDENTIAL_TYPE = None,
    loader_factory: Callable[[str], BaseLoader] | None = None,
)

初始化 `AzureBlobStorageLoader`。

参数 描述
account_url

Azure 存储帐户的 URL,例如 `https://.blob.core.windows.net`

类型: str

container_name

存储帐户中要从中检索 Blob 的容器名称

类型: str

blob_names

要加载的 Blob 名称列表。如果为 `None`,则将加载所有 Blob。

类型: str | Iterable[str] | None 默认值: None

prefix

从容器列出 Blob 时用于筛选的前缀。不能与 `blob_names` 一起使用。

类型: str | None 默认值: None

credential

用于向 Azure 存储帐户进行身份验证的凭据。如果为 `None`,将使用 `DefaultAzureCredential`。

类型: _SDK_CREDENTIAL_TYPE 默认值: None

loader_factory

可选的可调用对象,返回一个自定义文档加载器(例如 `UnstructuredLoader`)用于解析下载的 Blob。如果提供,Blob 内容将被下载到一个临时文件,其名称会传递给该可调用对象。如果为 `None`,内容将作为单个包含 UTF-8 文本的 `Document` 返回。

类型: Callable[[str], BaseLoader] | None 默认值: None

lazy_load

lazy_load() -> Iterator[Document]

从 Azure Blob Storage 延迟加载文档。

YIELDS 描述
Document

`Document` 对象。

alazy_load async

alazy_load() -> AsyncIterator[Document]

异步延迟加载 Azure Blob Storage 中的文档。

YIELDS 描述
AsyncIterator[Document]

`Document` 对象。

load

load() -> list[Document]

将数据加载到 `Document` 对象中。

返回 描述
list[Document]

文档。

aload async

aload() -> list[Document]

将数据加载到 `Document` 对象中。

返回 描述
list[Document]

文档。

load_and_split

load_and_split(text_splitter: TextSplitter | None = None) -> list[Document]

加载 `Document` 并将其分割成块。块将作为 `Document` 返回。

危险

不要重写此方法。应将其视为已弃用!

参数 描述
text_splitter

用于分割文档的 `TextSplitter` 实例。默认为 `RecursiveCharacterTextSplitter`。

TYPE: TextSplitter | None DEFAULT: None

引发 描述
ImportError

如果 `langchain-text-splitters` 未安装且未提供 `text_splitter`。

返回 描述
list[Document]

`Document` 列表。

© . This site is unofficial and not affiliated with LangChain, Inc.