- 标签:
- 工具 (25)
- RTOS (16)
- NLP (10)
- sql (8)
- 动态规划 (7)
- 树 (7)
- 聚类 (6)
- 图像 (4)
- 线性表 (4)
- 哈希 (4)
- pytorch (4)
- huggingface (4)
- LLM (4)
- Python (3)
- hive (3)
- 排序 (2)
- 字符串 (2)
- 二分查找 (2)
- 数学 (2)
- 强化学习 (2)
- 思考 (1)
- 开发 (1)
- 推荐 (1)
- 堆 (1)
- 海量数据 (1)
- 风控 (1)
- nosql (1)
🚈
tokenizer首先将给定的文本拆分为通常称为tokens的单词(或单词的一部分,标点符号等,在中文里可能就是词或字,根据模型的不同拆分算法也不同)。然后tokenizer能够将tokens转换为数字,以便能够构建张量并输入到模型中。