核心内容摘要
男女思维的奇妙碰撞:探寻“男生的因因,女生的困困”背后的真相
闻乐 发自 凹非寺量子位 | 公众号 QbitAI来围观腾讯青云奖学金颁奖竟然偶遇了姚顺雨。
这位27岁的腾讯首席AI科学家在腾讯大楼的线下公开亮相不是发布重磅产品也不是解读战略布局——而是给一群青年研究者颁发青云奖学金p.s.姚顺雨旁边的同学也是清华学子学长给学弟颁奖了……。
上一次他在公开场合露面还是在AGI-Next前沿峰会上。
这波在腾讯的首秀确实“不按常理出牌”。
为更值得的探索青云奖学金是腾讯针对顶尖技术人才的科研激励计划。
通过为每位获奖者提供20万元现金和价值30万元的云异构算力资源希望激发青年学者的创新潜能推动人工智能领域的前沿突破。
这次也是腾讯举办的青云奖学金的首届颁奖。
“从这些获奖者身上我们看到了向上的力量和向善的温度看到了青年学子敢于跨越已知边界、探索未知领域的勇气与实力。
我们也期待年轻学子们能扎实向前成为未来的科技领军人。
”腾讯首席人才官奚丹说。
趁着本次受邀前来参加颁奖仪式针对腾讯对于人才选拔的偏好本量子位帮大家提问了一波。
Q 选拔青云奖学金获得者时腾讯最看重候选人的哪些特质腾讯全球招聘负责人罗海波我们最看重的就是卓越的研究能力和深厚的学术造诣前瞻性的科研事业以及长期潜力和科研品位。
做科研是一件孤独的事情我们会比较关注学生这种底层的潜力。
此次姚顺雨通过青云计划奖学金颁奖完成他在腾讯的线下“首秀”也释放出一个明确信号——腾讯正在持续加码AI人才培养。
本届15位获奖学生研究领域涵盖了多个前沿领域以下为全部获奖名单。
获奖者们都说了些啥另外我们也和部分获奖的学生们聊了聊同学表示这个问题也是我想问姚顺雨的问题。
Q首先想问一下拿到青云奖金之后心情怎么样会怎么支配呢董冠霆首届腾讯青云奖学金我身边所有人都知道这个奖学金第一反应都是非常难拿。
然后钱的话我这边可能后续如果要是有什么去学术交流或者说是交换学术开会会议报销学术类的一些经费就比较充足了可以自由支配一下。
Q我们之前也比较关注过大模型安全这个方向或者说是AI谄媚、骗人所以说训练的时候就会按照人类的偏好来训练是吗那会不会影响这个模型回答的客观性吉嘉铭对因为我做的alignment比如说里面一个很核心的方法的话是RLHF其实就是基于人类反馈的强化学习就是想把人类的偏好训到模型里面它能够更按照我们意图回答这个其实也是2022年这个ChatGPT的成功。
但是现在我们其实也会做这种真实性的对齐。
就是其实现在的话这种human preference的话他们主要做啥呢其实就是做我现在问一个问题模型有回答a和回答b比如说他会定义一些维度来做这个人力偏好比如说信息的完整度、信息的正确性以及信息的这种结构性那这种偏好的话其实也不会说那么的不客观。
我们这个研究方向其实在国外还挺受重视的。
我之前也拿了那个苹果奖学金他们就特别关心decision因为他们认为就是前沿的技术或者说前沿的模型的训练的钥匙是掌控在我们手上的那我们一定要重视就是在一个训练的过程中模型可能出现的misalignment这个misalignment的话可能会造成严重的社会影响。
那我们讲模型和人对齐但是其实我们在用模型的过程中的话也会潜移默化地向模型进行对齐。
换句话而言的话在大模型出来之前的话我们看到所有的资讯、所有的稿子可能还是我们人写的那现在大模型时代下的话我们可能已经活在大模型的信息解耦里面了在这种双向对齐造成的叫value lock in就是价值锁定其实还挺可怕的。
Q最近Kimi出了一个新模型它比较鲜明特点就是一个智能体集群。
那你觉得这个智能体集群会是未来的一个主流的方向吗董冠霆多智能体其实是弥补单智能体缺陷的一个现在最简单的一个途径。
但我其实来看的话还是要把这些多智能体能力去集合到一个单智能体是比较强的所以我觉得多智能体只是一个中间态的过程。
我觉得理想化的一个情况下一定是要做成一个单智能体我认为现在其实是一个信息所谓瓶颈期不是叫技术的瓶颈期导致其实近半年来从R1开始。
大家的基础没有一个很本质的提升这在业界也是公认的但更本质上还是要想办法如何把这些知识合版或者说融合有机地融合到一个模型。
Q你们作为专业的学术人员要是新推出一款智能体会比较关注它的哪些能力呢胥嘉政比如现在我有代码智能code agent有search agent那其实for search、for code可能我要求的那期待的那个期望是不一样的比如说如果你是给code agent我可能希望你接到那个代码的工具里面能够帮我快速地提高我现在的效率。
如果是search agent可能我给你一个深度调研的任务我希望你能够帮我找到需要的一些材料而且你的这个引用是准的你帮我找到的那些材料是我需要的就是不同的智能体我对它有不同的期待。
PS这位天才少年今年只有20岁……Q那如果说优化智能体的话那你觉得什么方向上有很大的优化空间。
董冠霆这其实是我想问姚顺雨的问题就我觉得智能体其实现在大概两个方向一个是简单来说从workflow去做框架对齐一个是从训练角度去做其实这两个方向各有很多的人去在做有很多人坚信这两个方向都有它的意义。
那其实我自己也想看到底哪个方向是更重要的然后再往后的话可能我会更关注智能体的生成能力就是我可能就像刚才嘉政说的可能一个search agent我会期待它在search能力上有100分但可能我现在更希望看到的是。
在所有的智能体领域上有一个85分的能力就是我更期待看到这样的东西这种可能是更有通用愿景的一些东西。
白雨石我其实不太同意我觉得就是我们肯定期待一个很强的基模就是比如说像这种通用智能体的基模最好就是说同一个应用里可以支持又有这个agent又有那个agent但是它背后完全可以不是同一个模型。
就是它们可以去绕到不同的模型然后这些模型都是这种Domain-specific 去进行专业优化。
比如说 PPT workflow可能它的workflow和code agent workflow可能不太一样但是它们俩之间相似性其实还挺大。
那如果把它如果要做一个这种deep research的workflow那可能差距就会比较大那我觉得这些是没有必要再必须要合成同一个。
聊完只能说AI时代果然是一个百花齐放的时代……—欢迎AI产品从业者共建—「AI产品知识库」是量子位智库基于长期产品库追踪和用户行为数据推出的飞书知识库旨在成为AI行业从业者、投资者、研究者的核心信息枢纽与决策支持平台。
一键关注 点亮星标