OpenAI现允许网站阻止其网络爬虫抓取数据,避免数据被用于训练AI模型
(资料图)
OpenAI近日推出了一项新功能,允许网站阻止其网络爬虫从其网站上抓取数据训练GPT模型,以解决可能涉及到的数据隐私和版权问题。网络爬虫是一种自动化的程序,可以在互联网上搜索和获取信息。OpenAI的网络爬虫名为GPTBot,其会以一定的频率访问各种网站,并将网页内容保存下来,用于训练GPT模型。 OpenAI表示,网站运营者可以通过在其网站的Robots.txt文件中禁止GPTBot的访问,或者通过屏蔽其IP地址,来阻止GPTBot从其网站上抓取数据。OpenAI还表示,“使用GPTBot用户代理抓取的网页可能会被用于改进未来的模型,并且会过滤掉那些需要付费访问、已知收集个人身份信息(PII)、或者有违反我们政策的文本的来源。”对于不符合排除标准的来源,“允许GPTBot访问您的网站可以帮助AI模型变得更加准确,并提高它们的通用能力和安全性。” 然而,这并不会追溯性地从ChatGPT的训练数据中删除之前从网站上抓取的内容。互联网为大型语言模型(如OpenAI的GPT模型和谷歌的Bard)提供了大部分的训练数据,为AI训练获取数据已经变得越来越有争议。一些网站,包括Reddit和Twitter,已经采取措施打击AI公司免费使用其用户帖子的行为,而一些作者和其他创作者也因为涉嫌未经授权使用其作品而提起诉讼。
关键词:
相关阅读
-
OpenAI现允许网站阻止其网络爬虫抓取数...
OpenAI近日推出了一项新功能,允许网站阻止其网络爬虫从其网站上抓取数 -
声动中国丨在涿州,这些细节让人泪目……..
一方有难八方支援洪流围困之时五湖四海的人涌向涿州用勇气铸成希望之船 -
东星医疗董秘回复:公司目前尚未参与本...
东星医疗(301290)08月10日在投资者关系平台上答复了投资者关心的问题。 -
福贝宠物及董秘被监管警示,“事实不符...
暂时没有同行乖宝宠物(301498 SZ)敲钟挂牌的命,7月份在上市路上被终 -
从男色消费到女性表达,探寻“她经济”...
从男色消费到女性表达,探寻“她经济”在食品产业的蜕变与进阶,她经... -
伊登软件(01147.HK)拟8月18日举行董事会...
格隆汇8月8日丨伊登软件01147HK发布公告董事会会议将于2023年8月18日星 -
男主转生成自动贩卖机并到异世界开后宫...
在异世界题材越来越内卷的今天,一部作品若是没什么让人眼前一亮的设定 -
打新必看 | 8月9日三只新股上市,会破发吗?
1 威力传动(创业板)股票代码:300904发行价格:35 41发行市盈率:49 -
理想汽车第二季度营收286.5亿元:同比增...
DoNews8月8日消息,理想汽车8日发布2023年第二季度财报,财报显示,第 -
中国人寿重疾险交20后可以把钱拿出来吗...
不可以。 事实上,中国人寿重疾险并不是一种储蓄型保险,交纳的保费并 -
天地在线8月10日打开涨停
以下是天地在线在北京时间8月10日13:15分盘口异动快照:8月10日13点15 -
黄金市场行情依旧火热 黄金行业发展现...
黄金市场行情依旧火热进入火热的8月,黄金市场行情依旧火热,全球市场 -
2018成都二套房政策有哪些优惠(2018成...
2018成都二套房政策有哪些1、成都拥有一套住房且相应限购贷款未结清的 -
5年投资5亿元加码供应商赋能与创新 S...
今年上半年,SHEIN宣布5年投入5亿继续深化供应商赋能工作,并建立了首 -
【东海期货8月7日产业链日报】能化篇:...
沙特和俄罗斯延续减产短期继续承托了油价,但是前期的情绪对商品的驱动 -
宝能讨薪风波背后:五百亿撑不起姚振华...
但前宝能汽车高层刘星透露,宝能汽车当时从常熟工厂拉了十几台装好的车 -
5G开发运营概念股有哪些股票?(8月8日)
5G开发运营概念股有哪些股票?(8月8日),5G开发运营概念股有哪些股票 -
育碧《刺客信条:幻景》内购信息曝光:...
育碧旗下的游戏一直以“内购”为特色,玩家需要通过购买获取游戏内... -
你快回来活跃起来别再忍耐火力全开是什么歌
最近有很多的小伙伴都在问“你快回来活跃起来别再忍耐火力全开”这... -
海口市买房养老哪个地区好?滨江·悦景...
海口市买房养老哪个地区好?滨江·悦景对比盛世东城养老哪个好?海...