指南
CFGGuide
基础知识: Guide
生成文本的指南,该文本符合上下文无关的Lark语法。
Source code in outlines/fsm/guide.py
103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 | |
__init__(cfg_string, tokenizer)
构建PartialLark解析器并设置空的初始状态(PartialParserState)
Source code in outlines/fsm/guide.py
can_terminate_state(state)
允许生成终止
copy()
get_next_instruction(state)
返回引导生成的下一条指令。
当前的懒惰方法: - 对于词汇表中的每个标记 - 创建解析器状态的副本 - 将标记添加到解析器的输入文本中 - 如果有效,将标记添加到返回的标记中
进一步的改进对于高性能文本处理是必要的。
参数:
| 名称 | 类型 | 描述 | 默认值 |
|---|---|---|---|
state
|
CFGState
|
The guides current PartialParserState, or None if complete |
required |
返回:
| 类型 | 描述 |
|---|---|
一个包含模型和允许的令牌ID的`Generate`实例。
|
|
Source code in outlines/fsm/guide.py
get_next_state(state, token_id)
更新指南的状态。 解码token_id,并计算应用该token后的新parser_state。
参数:
| 名称 | 类型 | 描述 | 默认值 |
|---|---|---|---|
state
|
CFGState
|
The guides current PartialParserState, or None if complete |
required |
token_id
|
int
|
刚刚生成的令牌的ID。 |
必填 |
返回:
| 类型 | 描述 |
|---|---|
新的 PartialParserState 指南
|
|
Source code in outlines/fsm/guide.py
iter_valid_token_ids(state, candidate_token_ids)
遍历给定的 token_ids,并生成当前解析器状态下有效的部分。
参数:
| 名称 | 类型 | 描述 | 默认值 |
|---|---|---|---|
parser_state
|
解析器的当前状态,或者如果完成则为 None。 |
必需 | |
token_ids
|
要检查有效性的token ID列表。 |
必填 |
产出:
| 类型 | 描述 |
|---|---|
int
|
有效的令牌ID。 |
Source code in outlines/fsm/guide.py
must_terminate_state(state)
指南
基础: Guide
生成指南的基本定义。
生成指南定义了有限状态机的行为,该机器指导文本生成过程。与基于正则表达式构建的DFA不同,指南还可以发出Write指令,这告诉模型它可以追加一系列令牌(或令牌字)而不是生成它。
Source code in outlines/fsm/guide.py
RegexGuide
基础: RegexGuide
生成正则表达式语言的文本指南。
CoreRegexGuide 带有大纲缓存
Source code in outlines/fsm/guide.py
StopAtEOSGuide
基础知识: Guide
生成令牌的指南,直到生成EOS令牌。
Source code in outlines/fsm/guide.py
__init__(tokenizer)
初始化生成指南。
模型 用于生成下一个标记的对数几率生成器。