文档字符串遍历器
初始化文件。
文档字符串遍历器 #
基类:EventBaseReader
用于提取文档字符串并从中构建结构化文档的加载器。 递归遍历目录并从每个Python模块中提取文档字符串 - 从模块本身开始,然后是类,最后是函数。 构建提取的文档字符串之间的依赖关系图。
workflows/handler.py 中的源代码llama_index/readers/docstring_walker/base.py
16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 | |
load_data #
load_data(code_dir: str, skip_initpy: bool = True, fail_on_malformed_files: bool = False) -> List[文档]
从指定的代码目录加载数据。 此外,在加载数据后,构建已加载文档之间的依赖关系图。 该图作为类的属性存储。
Parameters#
code_dir : str 代码文件的目录路径。 skip_initpy : bool 是否跳过 init.py 文件。默认为 True。 fail_on_malformed_files : bool 是否在遇到格式错误的文件时失败。默认为 False - 在这种情况下, 格式错误的文件将被跳过并记录警告。
Returns#
List[Document] 已加载文档的列表。
workflows/handler.py 中的源代码llama_index/readers/docstring_walker/base.py
24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 | |
process_directory #
process_directory(code_dir: str, skip_initpy: bool = True, fail_on_malformed_files: bool = False) -> List[文档]
处理目录并从Python文件中提取信息。
Parameters#
code_dir : str 代码文件的目录路径。 skip_initpy : bool 是否跳过 init.py 文件。默认为 True。 fail_on_malformed_files : bool 是否在遇到格式错误的文件时失败。默认为 False - 在这种情况下, 格式错误的文件将被跳过并记录警告。
Returns#
List[Document] 一个文档对象列表。
workflows/handler.py 中的源代码llama_index/readers/docstring_walker/base.py
54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 | |
read_module_text #
read_module_text(path: str) -> str
读取一个Python模块的文本内容。在测试中,此函数可以被模拟。
Parameters#
路径 : 字符串 模块的路径。
Returns#
str 模块的文本内容。
workflows/handler.py 中的源代码llama_index/readers/docstring_walker/base.py
101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 | |
parse_module #
parse_module(module_name: str, path: str) -> 文档
用于解析单个Python模块的函数。
Parameters#
模块名称 : str 一个模块的名称。 路径 : str 模块的路径。
Returns#
文档 一个LLama索引文档对象,包含从模块中提取的信息。
workflows/handler.py 中的源代码llama_index/readers/docstring_walker/base.py
119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 | |
process_class #
process_class(class_node: ClassDef, parent_node: str)
处理抽象语法树中的类节点,并将相关信息添加到图中。
Parameters#
class_node : ast.ClassDef 要处理的类节点。它表示抽象语法树(AST)中的一个类定义。 parent_node : str 父节点名称。它指定图中父节点的名称。
Returns#
字符串 已处理类节点及其子元素的字符串表示形式。 它提供了已处理类节点及其子元素的文本表示形式。
workflows/handler.py 中的源代码llama_index/readers/docstring_walker/base.py
148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 | |
process_function #
process_function(func_node: FunctionDef, parent_node: str) -> str
处理AST中的函数节点并将其添加到图中。构建节点文本。
Parameters#
func_node : ast.FunctionDef 要处理的函数节点。 parent_node : str 父节点的名称。
Returns#
字符串 经过处理的函数节点及其子元素的字符串表示形式。
workflows/handler.py 中的源代码llama_index/readers/docstring_walker/base.py
177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 | |
process_elem #
process_elem(elem, parent_node: str) -> str
处理抽象语法树(AST)中的一个元素。
这是一个通用函数,根据元素的类型将执行委托给更具体的函数。
参数:
| 名称 | 类型 | 描述 | 默认 |
|---|---|---|---|
elem
|
AST
|
要处理的元素。 |
required |
parent_node
|
str
|
图中的父节点。 |
required |
graph
|
Graph
|
要更新的图表。 |
required |
返回:
| 名称 | 类型 | 描述 |
|---|---|---|
str |
str
|
处理元素的结果。 |
workflows/handler.py 中的源代码llama_index/readers/docstring_walker/base.py
204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 | |
选项: 成员:- DocstringWalker