Deepseek 新模型 R1052A
Deepseek 推出了全新模型 R1052A,尽管名字听起来像无人问津的《星球大战》机器人,但实力不容小觑。据其声称,该模型推理能力超越以往所有产品。经测试,它在自家图表上的表现直逼 OpenAI 3,部分测试甚至超过谷歌的 Gemini 2.5 Pro。
Deepseek 加强了对逻辑、谜题、数学和编码方面的训练,还难得地坦诚提及“幻觉”问题。多数团队以提高准确性为由掩盖这一问题,而 Deepseek 选择正视。不过,幻觉仍是当前 AI 领域的一大难题。
该模型界面无变化,但内在有乾坤。网络搜索功能改善,以往频繁出现的“出错”提示减少,变得顺畅。生活效果能自然融入,且模型不会混乱。虽功能不如 Chad GBT 丰富,但原始智能水平与之接近。此外,用户可下载完整模型,在性能尚可的笔记本上运行,拥有私人语言模型。
目前断言其完美还为时尚早,需在日常实际应用中进一步检验。但就速度而言,它与 GBT3 不相上下,去年这还像是科幻场景。
网络搜索问题与解决方案
Deepseek 新模型虽酷,但此前网络搜索功能不佳,可能是由于数据抓取方式不当。网站面对自动化请求会通过智能检测工具反击,同一 IP 地址大量请求易被封锁。
解决办法是使用优质代理,Node Maven 便是不错选择。其 90%以上的 IP 地址干净安全,远超其他大品牌。更少的不良 IP 意味着更少的封锁和捕获,减轻不少压力。而且,用户可通过浏览器扩展检查其质量。Node Maven 的代理可配置和定制,包括位置、会话类型和访问方式等。其独特的过滤管道确保地址在交付客户前经过严格筛选,用户只需为数据付费,未使用的带宽不会过期。
Deepseek 提示与规则
使用 Deepseek 时,首条信息至关重要,需明确需求、限制和期望的语言(仅支持英语和普通话)。若项目复杂,先给模型提供路线图,让其挖掘事实、检查合理性后再开始工作。避免将所有内容堆成一大段,否则模型会像小孩进糖果店般迷失方向。
可在私人笔记中添加清晰的“思考”标签,回复精炼内容,防止头脑风暴内容混入正式邮件。提供详细信息,如阅读对象、所需语气、长度等,甚至可链接相关文章以明确风格。模型生成草稿后,让其自评,指出弱点和模糊事实。若需新角度,可要求其提供多种观点并说明适用情况。若初稿风格不佳,可要求其调整为更友好、简短或更具吸引力的版本。
新 R1 模型的便携版
Deepseek 团队将新 R1 模型压缩为便携版,可在单个 GPU 上运行,拥有 80 亿参数,性能超越谷歌的 Gemini 2.5 Flash 等众多基准测试。其底层借鉴了阿里巴巴的 8 亿参数模型 Quan 3。
运行该便携版只需一张 40 - 80GB VRAM 的高端显卡,如价值约 25000 美元的 Nvidia H100。而完整版 Deep Seek R1 通常需要十几张这样的显卡,便携版大幅降低了硬件需求,且性能损失不大。
此前 Deepseek 已有适合笔记本的 8 亿参数模型,但新版采用全新训练技巧,推理能力更强。开发者称新版是研究人员的实验场和小型工业项目的启动平台,翻译公司无需租用服务器农场就能获得强大支持。这对 Chad GBT、Gemini 和 Claude 等构成威胁,对普通用户是炫耀资本,对企业则是游戏规则改变者。
中国产模型的问题
这些新模型大多来自中国,面临审查问题。Deep Seek 虽声称独立,无政府资金和限制,但模型仍有限制,如涉及台湾问题时会拒绝回答。因此,用户需掌握与模型交流的技巧。
为帮助用户,团队为会员准备了速成课程,涵盖从基础提示到高级技巧。目前,Geek Academy 提供六个月访问权限 50%的折扣。
其他 AI 新闻
OpenAI 与 Wix 合作
OpenAI 与 Wix 合作,推出网站建设功能。用户只需在聊天框输入需求,如“我要开一家宠物零食店”,即可生成完整网站,包括布局、图片、文案和预订或商店应用等。GBT 还能撰写博客、编辑或生成图片、生成业务报告并翻译网站。这或许能让普通人轻松创建个人网站。
Meta AI 的用户数量争议
Meta 在财报电话会议上称 Meta AI 每月活跃用户达 10 亿,但实际情况并非如此。Meta 将旗下所有应用(如 Facebook、WhatsApp 和 Instagram)中可能接触到 Meta AI 的用户都计算在内,即便用户从未使用过。这种统计方式更像是市场宣传,而非真正的里程碑。
Perplexity 的升级
Perplexity 为专业用户推出 Labs 功能,用户可创建 AI 项目,无需代码编辑器和复杂操作,就能处理多步骤任务,如处理数据、生成图表、制作网站等。用户可选择喜欢的语言模型,添加浏览、代码运行或图形工具。Labs 还能辅助日常工作,如起草营销活动、分析财务报表等。
此外,Perplexity 还推出深度研究功能,用户提问后几分钟内就能获得引用丰富的详细报告。
Hugging Face 的人形机器人
Hugging Face 推出两款开源人形机器人,一款高瘦,有 66 个关节,能行走、挥手、转头等;另一款较小较简单。两款机器人的所有部件和代码均开源,价格分别约为 3000 美元和 300 美元。Hugging Face 希望让更多人能参与机器人的构建、调整和学习。
Telegram 与 XAI 的合作
Telegram 与 Elon 的 XAI 合作,将 Grock 引入 Telegram 应用。XAI 投资约 3 亿美元现金和股权,Telegram 获得 Grock 订阅收入的一半。
首批用户为 Telegram 高级会员,之后向所有用户开放。Grock 可能会出现在聊天列表顶部,方便用户使用。其功能包括优化消息、总结长聊天、处理链接和文档、生成定制贴纸等。但用户需关注隐私问题,希望 Telegram 能保证端到端加密或提供本地运行版本。
Opera 的新浏览器 Neon
Opera 推出新浏览器 Neon,主打内置 AI 工作流程。浏览器不仅能浏览网页,还能购物、自动填写表单、编写代码等。其内置的 Opera 代理在 3 月首次亮相,从演示来看,功能强大。但目前 Neon 处于等待名单中,且可能需要订阅,实际使用效果有待检验。
总之,当前 AI 领域充满活力,每周都有新模型推出,各种创新令人期待。若想提升 AI 技能,可通过 Geek Academy 链接了解更多。