网站首页 > 博客文章 正文
TableGPT2:一个经过严格预训练和微调的模型,涉及超过59.38万个表格和236万个高质量的查询-表格-输出元组,这是以前研究中前所未有的表格相关数据规模。在以表格为中心的任务中表现出色,同时保持了强大的通用语言和编码能力。
TableGPT2有两种配置——7B 和 72B 参数——均源自 Qwen2.5 模型系列,已开源了7B 版本。
- 在23个基准测试指标上,TableGPT2在7B模型上比之前的基准中性LLMs平均性能提高了35.20%,在72B模型上提高了49.32%。
- 在某些基准测试中,TableGPT2甚至达到了优于或相当于GPT-4o的结果。
- 在涉及层次结构化表格的复杂数据基准测试,如HiTab中,TableGPT2执行准确率比Qwen2.5系列高出超过60%的绝对增长。
TableGPT2的定性案例
模型架构
TableGPT2-7B 基于 Qwen2.5 架构构建,包含专门用于表格数据的编码。它具有独特的语义编码器,旨在解释表格数据,从行、列和整个表格中获取见解。已应用持续预训练 (CPT) 和监督微调 (SFT),以使模型能够用于实际的 BI 应用程序和复杂的查询处理。
TableGPT2的一个关键创新是其新颖的表格编码器,专门设计来捕获模式级别和单元格级别的信息。这个编码器增强了模型处理模糊查询、缺失列名和不规则表格的能力,这些在现实世界的应用中很常见。与视觉-语言模型(VLMs)类似,这种方法与解码器集成,形成了一个强大的大型多模态模型。
TableGPT2整体技术框架
语义表格编码器的总体设计
https://huggingface.co/tablegpt/TableGPT2-7B
https://arxiv.org/pdf/2411.02059
TableGPT2: A Large Multimodal Model with Tabular Data Integration
https://github.com/tablegpt/tablegpt-agent
本文,完。觉得本篇文章不错的,记得随手点个赞、收藏和转发三连,感谢感谢~如果想第一时间收到推送,请记得关注我们?~
猜你喜欢
- 2025-01-13 73页,开源后训练全流程!AI2发布Tülu 3系列模型,拉平闭源差距
- 2025-01-13 拒绝付费!内置本地离线专属 ChatGPT,免费开源 AI 生产力工具箱
- 2025-01-13 关于 GPT-4 Vision 的开源替代品需要了解什么
- 2025-01-13 Meta开源大语言模型Llama 2,结盟微软、高通对抗GPT-4?
- 2025-01-13 免费可商用开源GPT模型问世,50G权重直接下载,性能不输GPT-3
- 2025-01-13 Meta开源Llama 2免费大语言模型,媲美ChatGPT,可在线试玩
- 2025-01-13 爆火全网的ChatGPT,这些问题您可能想知道
- 2025-01-13 开源版SearchGPT来了,两张3090就可复现,超越Perplexity付费版
- 2025-01-13 Qwen2.5登全球开源王座!72B击败LIama3 405B,轻松胜GPT-4o-mini
- 2025-01-13 爆火出圈的ChatGPT,和它背后的万亿商业化狂想
你 发表评论:
欢迎- 366℃用AI Agent治理微服务的复杂性问题|QCon
- 358℃初次使用IntelliJ IDEA新建Maven项目
- 353℃手把手教程「JavaWeb」优雅的SpringMvc+Mybatis整合之路
- 351℃Maven技术方案最全手册(mavena)
- 348℃安利Touch Bar 专属应用,让闲置的Touch Bar活跃起来!
- 346℃InfoQ 2024 年趋势报告:架构篇(infoq+2024+年趋势报告:架构篇分析)
- 344℃IntelliJ IDEA 2018版本和2022版本创建 Maven 项目对比
- 342℃从头搭建 IntelliJ IDEA 环境(intellij idea建包)
- 最近发表
- 标签列表
-
- powershellfor (55)
- messagesource (56)
- aspose.pdf破解版 (56)
- promise.race (63)
- 2019cad序列号和密钥激活码 (62)
- window.performance (66)
- qt删除文件夹 (72)
- mysqlcaching_sha2_password (64)
- ubuntu升级gcc (58)
- nacos启动失败 (64)
- ssh-add (70)
- jwt漏洞 (58)
- macos14下载 (58)
- yarnnode (62)
- abstractqueuedsynchronizer (64)
- source~/.bashrc没有那个文件或目录 (65)
- springboot整合activiti工作流 (70)
- jmeter插件下载 (61)
- 抓包分析 (60)
- idea创建mavenweb项目 (65)
- vue回到顶部 (57)
- qcombobox样式表 (68)
- vue数组concat (56)
- tomcatundertow (58)
- pastemac (61)
本文暂时没有评论,来添加一个吧(●'◡'●)