🤖GPT-4 通过图灵测试!!
研究人员称人们在图灵测试中无法区分 GPT-4 和人类,圣地亚哥加州大学认知科学系的研究人员针对GPT 4复刻了图灵测试。
研究人员招募了500名参与者,与四个代理人:人类、1960年代的ELIZA程序、GPT-3.5和GPT-4交谈,以测试他们是否能分辨出哪个是人类。
研究结果显示,参与者认为GPT-4是人类的概率为54%,而ELIZA只有22%,GPT-3.5为50%,人类为67%。
🔗详细内容,以及实验设计的完整提示词:https://xiaohu.ai/p/10033
📚首个 AI 高考评测结果发布:GPT-4o 名列第二!
- 上海人工智能实验室使用其司南评测体系OpenCompass,选取6个开源模型及GPT-4o,进行高考“语数外”全卷能力测试。
- 评测采用全国新课标I卷,参与评测的所有开源模型,开源时间均早于高考。 同时,成绩由具有高考评卷经验的教师人工评判。
- 评测采用“语数外”三科题目作为测试集,仅输入文字题干(数学包含2道带图试题),不纳入英语听力部分(30分)。
- 总分前三名Qwen2-72B、GPT-4o、InternLM2-20B-WQX对应得分率分别为72.1%、70.5%和70.4%。
- 大部分模型在“语言”本质上的表现良好,语文平均得分率为67%,英语更是达到了81%。
- 而数学则是所有大模型的短板,平均得分率仅为36%。
🔗GAOKAO-Eval高考评估模型GitHub: https://github.com/open-compass/GAOKAO-Eval
🔗 https://blink.csdn.net/details/1735786
💻Genspark:一个新的 AI 驱动搜索引擎登场
- 与Perplexity一样,Genspark也是利用生成式AI来撰写定制的搜索摘要。
- Genspark会根据搜索的内容生成一个Sparkpage页面:一个由搜索结果内容聚合而成的网络单页。可以在这个页面找到关于你问题答案的各种信息。
- AI创建页面后,任何人都可以分享和编辑Sparkpage的副本,并添加任何他们希望的信息——包括冒犯性的、错误的或剽窃的信息。
🔗官网:https://www.genspark.ai/
🔗 https://blink.csdn.net/details/1735747
👤TikTok 推出生成式 AI 内容工具套件 Symphony
- 包含一系列 AI 内容生成工具
1、Symphony Assistant AI帮手 可以告诉你当前TikTok上最流行的内容是什么,以及帮你生成视频脚本
2、Symphony Creative Studio 只需提供产品详情、现有素材或产品链接 就能在60秒内生成多种TikTok视频预览
3、支持将脚本和配音翻译成多种语言,帮助你扩展全球受众
4、Symphony Digital Avatars 数字人 ,内置多种数字人,也可以自己创建真实人物数字人头像
5、提供多种AI驱动的广告创作和优化功能,帮助提升广告表现。自动诊断和修复广告。
🔗 https://www.tiktok.com/business/en-US/blog/tiktok-symphony-ai-creative-suite
🔗 https://blink.csdn.net/details/1735772
🖼️AI生图可“量身定制”!华为清华联手推个性化生成技术PMG
- PMG技术通过分析用户历史行为和偏好,生成符合个性化需求的多模态内容。
- PMG技术实现关键词生成和隐向量生成,结合用户偏好和目标项关键词,优化生成内容。
- PMG技术在电商服装图片生成、电影海报场景和表情生成等应用场景验证了其有效性,展现出色的表现。
🔗 https://github.com/mindspore-lab/models/tree/master/research/huawei-noah/PMG
🔍百度文库:AI产品“橙篇”已支持10万字长文生成
- 集成专业知识检索、超长图文理解、深度编辑等功能,提升用户创作效率。
- 支持用户上传多种格式文件并进行快速总结、问答和创作,领先行业。
- 能一次性生成最多10万字长文,支持多格式、跨模态内容的深度编辑和调整。
🔗 橙篇AI - 用橙篇,就成了