海天瑞声推千万轮对话预料库 7.9亿定增募资拟投向AI大模型训练数据集建设等项目
7月27日,海天瑞声宣布正式推出「中文千万轮对话语料库DOTS-NLP-216」
(资料图片)
7月27日,海天瑞声宣布正式推出「中文千万轮对话语料库DOTS-NLP-216」。
海天瑞声方面分析认为,当前在中文对话领域,公开的数据集往往量少、分布有偏、价格昂贵甚至不能商用。导致一些大模型在中文对话方面的能力,相比英文对话略逊一筹。尤其是在一些需要比较深的中文语言理解能力的对话场景,无论开源的还是闭源的大模型,都往往表现不佳。
海天瑞声方面表示,真实场景采集,符合中文表达习惯的自然对话数据,将为中文大语言模型(LLM)带来新动能。
据海天瑞声方面介绍,此次发布的数据集,是一个符合中国人表达习惯的自然对话数据集,共计约1000万轮,上亿级token(标记)。
此前,海天瑞声发布公告称,拟定增募资不超过7.9亿元,其中,3.83亿元计划用于“AI大模型训练数据集建设项目”,4.07亿元计划投向“数据生产垂直大模型研发项目”。
海天瑞声在公告中表示,在人工智能产业进入以大模型为代表的新的发展时期,通过本次募投项目的实施,公司将建设一批适用性较强的大模型训练数据集,拓展潜在高增长价值的新型业务板块,并藉此进一步扩大公司业务规模;同时,以研发海天瑞声数据生产垂直大模型为核心,升级海天瑞声一体化技术支撑平台,研发并引入多项新兴技术,促进公司科技创新水平的不断提升,巩固公司的核心技术壁垒,构建长期技术实力支撑,从而进一步增强公司核心竞争力。
关键词:
7月27日,海天瑞声宣布正式推出「中文千万轮对话语料库DOTS-NLP-216」
近日,由中央网信办主办的2022中国正能量网络精品征集展播活动正式
自7月份以来,金安区城管局(支队)在区安委会领导下,认真贯彻落实省、
分时图快速拉升意味此时存在大单买入,在大单的推动下,股价快速地上涨
【CNMO新闻】上一轮调整过后,国内油价涨0 22元 升-0 25元 升。其中,9
本报北京7月27日电(记者王浩、何佳译)近日,国家水土保持监测站点优化
近日,由四川省仪陇县与温州医科大学附属眼视光医院携手共建的仪陇县联
【业绩好于预期英特尔盘后大涨8%!英特尔CEO:人工智能推动个人电脑销
24小时财经资讯平台,依托新锐财经日报《每日经济新闻》(NationalBusin
湖南日报·新湖南客户端7月27日讯(通讯员周朝谢纯)日前,中石化益阳分
因为上海上港晋级正赛后,将与韩国联赛冠军全北现代、日本联赛霸主横滨
光谷发布中英文双语普法读本AI虚拟主播“小光”“小谷”担任服务官---
你自以为是的爱,却让孩子无法自由呼吸,强迫他一味地生活在与别人的比
为大力弘扬伟大的抗美援朝精神,充分发挥红色影像资源的引领作用,由中
热门中概股多数下跌,哔哩哔哩跌超6%,京东跌超3%,唯品会、腾讯音乐跌
水蓝色刘人语(Reyi,2001年10月10日-),出生于四川省德阳市,中国内
7月27日,国家金融监督管理总局(下称金融监管总局)召开银行业保险业2
1、根据主线任务有个龙脉的教程走,就能上去了,或者你跑到地图最接近
炎炎夏日进入“炙烤”模式,与天气同样火爆的还有暑期的儿科。“小病号
近日,2023山东数字强省宣传月活动在济南正式启动,省委常委、常务副省
东北证券预计,上半年公司实现营业收入35 46亿元,同比增加47 61%;实
俄罗斯总统普京当地时间26日在圣彼得堡与金砖国家新开发银行行长罗塞夫
在刚刚结束的2026美加墨世界杯预选赛亚洲区36强阶段比赛抽签仪式上,中
“面包车就像失控一样,撞到路边吃夜宵的一桌人。”7月26日,有网友向
大家纷纷赞赏“小魔王”在面对困难时足够冷静、果断,但李隼在比赛间隙
Copyright 2015-2022 每日酒业网 版权所有 备案号:浙ICP备2022016517号-15 联系邮箱:5 146 761 13 @qq.com