mirror of
https://gitee.com/microic/tr.git
synced 2025-12-06 10:19:05 +08:00
ChatCRNN
本项目暂无任何实用价值,仅用于测试TransformerEncoder的推理能力,算法细节可参考:
https://www.zhihu.com/question/605567747/answer/3441552623
测试环境: Ubuntu 18+
| 任务 | 状态 | 说明 |
|---|---|---|
| 三位整数乘法 | 测试精度约为99.994% |
不依赖CoT、编程等任何辅助方式 Transformer层数:7 |
| 四位整数乘法 | 测试精度约为99.949% |
不依赖CoT、编程等任何辅助方式 Transformer层数:7 |
| 数数 | 测试精度约为99.981% |
统计字符串中字母的个数 不依赖CoT、编程等任何辅助方式 Transformer层数:7 |
实验总结
TransformerEncoder+CTCLoss组合已经在多行文本识别、图像识别、多位整数乘法、数数等不同任务上表现出了很强的适应性。
在语音识别领域,TransformerEncoder+CTCLoss组合也有着广泛的应用: https://huggingface.co/learn/audio-course/chapter3/ctc