网站首页 > 博客文章 正文
图形神经网络引发了基于图形的文本分类方法的复苏,定义了今天的技术状态。我们表明,使用词袋(BoW)的简单多层感知器(MLP)在归纳文本分类环境中优于先前的基于图的模型TextGCN和HeteGCN,在单标签分类中与HyperGAT相当。我们还对多标签分类进行了自己的实验,其中简单的MLP胜过最近的基于序列的gMLP和aMLP模型。此外,我们对一个基于序列的BERT和一个轻量级的DistilBERT模型进行了微调,这两个模型在大多数数据集的单标签和多标签设置上都优于所有模型。这些结果对现代文本分类器中使用的合成图的重要性提出了质疑。就参数而言,DistilBERT仍然是我们基于BoW的广义MLP的两倍,而基于图的模型如TextGCN需要设置一个$mathcal{O}(N^2)$图,其中$N$是词汇加语料库的大小。
《Bag-of-Words vs. Sequence vs. Graph vs. Hierarchy for Single- and Multi-Label Text Classification》
论文地址:http://arxiv.org/abs/2204.03954v1
- 上一篇: 膏方出现“返砂”还能继续服用吗?
- 下一篇: 斌哥带你学AI——文本分类(文本分类实战)
猜你喜欢
- 2024-10-01 PyTorch学习笔记 7.TextCNN文本分类
- 2024-10-01 77-批量查找并标记包含指定文本的行列 Excel表格处理程序 办公技巧
- 2024-10-01 如何让Excel图表看起来不那么小白?
- 2024-10-01 居于条形之间的分类轴标签
- 2024-10-01 ipad上可以给文字分类的辅助工具是什么?可以分类的便签
- 2024-10-01 机器学习入门教程-第十八课:文本分类的魔法
- 2024-10-01 14种分类算法进行文本分类实战(文本分类原理)
- 2024-10-01 斌哥带你学AI——文本分类(文本分类实战)
你 发表评论:
欢迎- 368℃用AI Agent治理微服务的复杂性问题|QCon
- 363℃手把手教程「JavaWeb」优雅的SpringMvc+Mybatis整合之路
- 358℃初次使用IntelliJ IDEA新建Maven项目
- 351℃Maven技术方案最全手册(mavena)
- 348℃安利Touch Bar 专属应用,让闲置的Touch Bar活跃起来!
- 347℃InfoQ 2024 年趋势报告:架构篇(infoq+2024+年趋势报告:架构篇分析)
- 345℃IntelliJ IDEA 2018版本和2022版本创建 Maven 项目对比
- 343℃从头搭建 IntelliJ IDEA 环境(intellij idea建包)
- 最近发表
- 标签列表
-
- powershellfor (55)
- messagesource (56)
- aspose.pdf破解版 (56)
- promise.race (63)
- 2019cad序列号和密钥激活码 (62)
- window.performance (66)
- qt删除文件夹 (72)
- mysqlcaching_sha2_password (64)
- ubuntu升级gcc (58)
- nacos启动失败 (64)
- ssh-add (70)
- jwt漏洞 (58)
- macos14下载 (58)
- yarnnode (62)
- abstractqueuedsynchronizer (64)
- source~/.bashrc没有那个文件或目录 (65)
- springboot整合activiti工作流 (70)
- jmeter插件下载 (61)
- 抓包分析 (60)
- idea创建mavenweb项目 (65)
- vue回到顶部 (57)
- qcombobox样式表 (68)
- vue数组concat (56)
- tomcatundertow (58)
- pastemac (61)
本文暂时没有评论,来添加一个吧(●'◡'●)