首页 股吧 正文

大禹节水(丹东配资)

2023-05-19 20:05:58 26 0
admin

苹果公司的Siri等私家助理可以通过天然言语指令来完成任务。但是,它们的基础组件一般依赖于监督的机器学习算法,这些算法需求许多的手工注释操练数据。为了减少收集数据的时间和精力,Apple的研讨人员开发了一个结构,该结构运用用户参与信号自动创建数据增强标签。他们陈讲述,当运用比方多任务学习和外部知识库验证之类的战略进行吞并时,带注释的数据将大大提高出产深度学习系统的准确性。

“我们信赖这是初度运用用户参与信号来帮忙大规模生成序列符号任务的操练数据,并且可以在实践设置中运用,以在几乎没有人工注释数据的情况下加快新功用的安置,”研讨人员在预印本上写道。“此外…用户参与信号可以通过从自身的差错中学习来帮忙我们承认数字助理需求改善的当地。”

研讨人员运用了一系列启发式办法来辨认标明积极参与或低沉参与的行为。其间一些功用包含轻按内容以使其进一步参与(必定照应),长时间听歌(另一个必定照应)或打断智能辅佐供应的内容并手动选择其他内容(否定照应)。这些信号以“保存隐私的办法”被有选择地收集,以自动产生地上底细注释,随后将它们与人类注释者供应的粗粒度标签组合在一同。

为了将粗粒度标签和揣度的细粒度标签吞并到AI模型中,论文的一同作者规划了一个多任务学习结构,该结构将粗粒度和细粒度实体标签视为两个任务。此外,他们并入了一个由实体及其联络组成的外部知识库验证器。给定“某事”作为音乐标题,并将“甲壳虫”作为音乐艺术家,对查询“由披头士演奏某事”进行查询,验证器将查找顶部标签替代项并将其发送到一个组件,该组件将对猜想进行排名,并回来最佳选择。

研讨人员进行了两个单独的检验集,以点评由多任务模型实行的任务,他们通过从出产系统中随机抽样并运用地上实在标签进行手动注释来对其进行编译。他们说,在21个模型工作中,与全部人类注释数据量的基线比较,“一致地”增加了260,000个操练示例“一致地”降低了猜想任务的粗粒度实体差错率。此外,他们陈讲述,当人工注释的数据量相对较小时(5,000个示例),增加弱监督的细粒度数据会产生更大的影响。终究,他们陈讲述,在任何顶级模型假定通过知识库验证器的示例中,细粒度实体差错率下降了约50%。

在另一个实验中,该团队妄图承认用户意图的更精细标明是否会增加系统选择正确动作的可能性。他们采样了大约5,000个“播放音乐”指令,这些指令包含对多个乐队,艺术家和歌曲的引用,并通过包含其结构的系统发送给他们,此后,他们要求注释者将系统回来的照应分级为“满意”或“不满意”。研讨人员陈讲述,增强型系统产生的效果使相对任务差错率降低了24.64%。

他们留下往后的作业,探求怎样运用个人用户的参与行为来改善个性化。

一同作者写道:“我们观察到,我们的模型改善了面向用户的效果,尤其是关于包含困难或失常言语方式的央求而言。”“例如,增强型系统正确处理了比方“您能否从MileyCyrus的新专辑中播放Malibu”和“通过我的音乐KendrickLamar播放Humble”之类的查询。此外,增强型模型还可以辨认用户更可能在其间引用的实体实在的言语歧义的案例。例如,在“由Metallica播放一个”中,“一个”可以对错实体令牌(意味着播放Metallica的任何歌曲),也可以专门指“Metallica”称为“One”的歌曲。因为大多数用户每当他们说“由Metallica演奏”时,只需听听“Metallica”的歌曲“One”,我们的模型就可以在参与度注释数据的基础上进行操练,然后可以猜想“one”作为[音乐称谓],然后更好地捕捉趋势和偏好在我们的用户群中。”

这项作业紧随描绘苹果公司Overton的论文之后,Overton是一种AI开发工具,其模型现已处理了“数十亿”次查询。其他,Cupertino公司最近还研讨了用户是否喜欢与“更幽默”的AI辅佐进行对话。

大禹节水(丹东配资)

收藏
分享
海报
0 条评论
26

本站已关闭游客评论,请登录或者注册后再评论吧~