騰訊,大動(dòng)作

2025-06-27 23:14:38 來(lái)源: 中國基金報 作者:張燕北

  【導讀】騰訊混元推出首款開(kāi)源混合推理模型,擅長(cháng)Agent工具調用和長(cháng)文理解

  頭部互聯(lián)網(wǎng)公司旗下大模型加速開(kāi)源。

  6月27日,騰訊混元開(kāi)源的首款混合推理MoE模型Hunyuan-A13B發(fā)布,該模型是業(yè)界首個(gè)13B級別的MoE開(kāi)源混合推理模型,其效果比肩同等架構領(lǐng)先開(kāi)源模型。

  開(kāi)源模型靈活性、透明度和成本優(yōu)勢,為人工智能產(chǎn)業(yè)發(fā)展帶來(lái)新機遇。今年年初DeepSeek出圈后,騰訊、阿里、字節等頭部互聯(lián)網(wǎng)公司旗下大模型開(kāi)源悄然加速。

  騰訊混元開(kāi)源首款混合推理MoE模型

  騰訊混元宣布開(kāi)源首個(gè)混合推理MoE模型Hunyuan-A13B,總參數80B,激活參數僅13B,效果比肩同等架構領(lǐng)先開(kāi)源模型,但是推理速度更快,性?xún)r(jià)比更高,這意味著(zhù),開(kāi)發(fā)者可以用更低門(mén)檻的方式獲得更好的模型能力。

  即日起,模型已經(jīng)在Github和Huggingface等開(kāi)源社區上線(xiàn),同時(shí)模型API也在騰訊云官網(wǎng)正式上線(xiàn),支持快速接入部署。

  據了解,這是業(yè)界首個(gè)13B級別的MoE開(kāi)源混合推理模型,基于先進(jìn)的模型架構,Hunyuan-A13B表現出強大的通用能力,在多個(gè)業(yè)內權威數據測試集上獲得好成績(jì),并且在A(yíng)gent工具調用和長(cháng)文能力上有突出表現。

  *加粗為最高分,下劃線(xiàn)表示第二名,數據來(lái)源于模型各個(gè)公開(kāi)的測試數據集得分

  在實(shí)際使用場(chǎng)景中,Hunyuan-A13B模型可以根據需要選擇思考模式?焖伎寄J教峁┖(jiǎn)潔、高效的輸出;慢思考則涉及更深、更全面的推理步驟,如反思和回溯。

  Hunyuan-A13B模型對個(gè)人開(kāi)發(fā)者較為友好,在嚴格條件下,只需要1張中低端GPU卡即可部署。目前,Hunyuan-A13B已經(jīng)融入開(kāi)源主流推理框架生態(tài),無(wú)損支持多種量化格式,在相同輸入輸出規模上,整體吞吐量是前沿開(kāi)源模型的2倍以上。

  Hunyuan-A13B集合了騰訊混元在模型預訓練、后訓練等多個(gè)環(huán)節的創(chuàng )新技術(shù),這些技術(shù)共同增強了其推理性能、靈活性和推理效率。

  騰訊方面相關(guān)人士表示,Hunyuan-A13B模型是騰訊內部應用和調用量最大的大語(yǔ)言模型之一,有400+業(yè)務(wù)用于精調或者直接調用,日均請求超1.3億次。

  本次進(jìn)行升級更新并對外開(kāi)源,是繼混元Large后混元大語(yǔ)言模型推出的又一重要開(kāi)源模型,其參數更小,但是性能和效果實(shí)現了大幅的提升。接下來(lái),騰訊混元將推出更多尺寸、更多特色的模型,將更多實(shí)踐技術(shù)與社區共享,促進(jìn)大模型開(kāi)源生態(tài)的繁榮。

  開(kāi)源浪潮席卷行業(yè)

  2024年大模型從科技前沿走向大眾視野,2025年DeepSeek火爆出圈,開(kāi)源正在成為國內外眾多大模型的“必選項”。

  據不完全統計,僅今年3月至今,OpenAI、谷歌、Meta、英偉達、阿里、DeepSeek、智譜AI、群核科技、階躍星辰等全球多家科技巨頭已密集發(fā)布超10款開(kāi)源大模型。

  與此同時(shí),開(kāi)源模型性能持續突破,AI開(kāi)源社區Hugging Face的模型榜單不斷被刷新。無(wú)論是科技巨頭,還是初創(chuàng )企業(yè),都在加快步伐擁抱開(kāi)源浪潮。共享最新前沿技術(shù)成果的同時(shí),這些企業(yè)也在致力于降低算力成本。

  就國內而言,字節跳動(dòng)豆包、昆侖萬(wàn)維300418)、百度文心、阿里通義千問(wèn)等今年均推出開(kāi)源模型。當前,頭部互聯(lián)網(wǎng)公司旗下大模型開(kāi)源仍在加速。

  5月30日凌晨,阿里巴巴開(kāi)源了創(chuàng )新自主搜索AI Agent——WebAgent。WebAgent具備端到端的自主信息檢索與多步推理能力,就像人類(lèi)一樣在網(wǎng)絡(luò )環(huán)境中主動(dòng)感知、決策和行動(dòng),例如,當用戶(hù)想了解某個(gè)特定領(lǐng)域的最新研究成果時(shí),WebAgent能夠主動(dòng)搜索多個(gè)學(xué)術(shù)數據庫,篩選出最相關(guān)的文獻,并根據用戶(hù)的需求進(jìn)行深入分析和總結。

  字節跳動(dòng)Seed團隊也有新動(dòng)作,發(fā)布并開(kāi)源了多模態(tài)基礎模型BAGEL,該模型擁有70億個(gè)活躍參數,總參數達140億個(gè)。BAGEL集視覺(jué)理解、文生圖、圖像編輯于一體,在標準多模態(tài)理解基準測試中表現出色,優(yōu)于現有頂級開(kāi)源視覺(jué)語(yǔ)言模型如Qwen2.5-VL和InternVL-2.5。

  麥肯錫公司聯(lián)合Mozilla基金會(huì )、Patrick J.McGovern基金會(huì )發(fā)布的《AI時(shí)代的開(kāi)源技術(shù)》報告顯示,全球超過(guò)50%的企業(yè)已在數據、模型及工具層面采用開(kāi)源AI技術(shù)。

  開(kāi)源模型通過(guò)提供高質(zhì)量的模型權重和訓練代碼,支持模型的預訓練、微調和定制,助力科創(chuàng )企業(yè)基于現有的強大模型進(jìn)行快速開(kāi)發(fā),避免了從頭開(kāi)始構建AI系統的高昂成本。企業(yè)可依據業(yè)務(wù)所需靈活調用模型組件、算法框架和推理引擎,實(shí)現從“重資產(chǎn)開(kāi)發(fā)”到“輕量化集成”的轉型路徑,大幅降低了創(chuàng )新門(mén)檻和試錯成本。

  據了解,未來(lái)混元計劃推出多尺寸混合推理模型,從0.5B到32B的Dense模型,以及多個(gè)MoE模型,適配企業(yè)與端側不同需求,混元圖像、視頻、3D等多模態(tài)基礎模型及配套插件模型也將持續開(kāi)源。

關(guān)注同花順財經(jīng)(ths518),獲取更多機會(huì )

0

+1
  • 三德科技
  • 沃爾核材
  • 電光科技
  • 鈞崴電子
  • 金安國紀
  • 長(cháng)盛軸承
  • 廣和通
  • 科泰電源
  • 代碼|股票名稱(chēng) 最新 漲跌幅