快手正式發布了多模態大語言模型KeyeVL1.58B。與之前的版本相比,KeyeVL1.5的綜合性能實現顯著提升,尤其在基礎視覺理解能力方面,包括視覺元素識別、推理能力以及對時序信息的理—表現尤為突出。KeyeVL1.5在同等規模的模型中表現出色,甚至超越了一些閉源模型如GPT4o。KeyeVL1.58B在技術上實現了三項關鍵創新:引入慢快編碼策略(SlowFast):該策略基于相似性算法自動區分慢幀與快幀,并將快幀的token預算控制為慢幀的30%。同...
?導讀:快手KwaiKeye團隊提出Thyme(ThinkBeyondImages)的新范式,并圍繞它構建了一整套技術方案。旨在突破現有方法的限制,賦予開源模型一種更強大、更自主、功能更全面的“超越圖像思考”的能力。??OpenAI推出的o3推理模型,首次將圖像直接融入推理過程,開創了視覺文本聯合推理的新范式。該能力(ThinkwithImage)自發布以來,受到業界與學術界的廣泛關注,多項研究開始探索如何在推理中引入視覺信息以增強模型感知與推理...
2025-08-29 17:03:29 1070瀏覽 0點贊 0回復 0收藏
近日,快手Kwaipilot團隊發布了SeamlessFlow技術報告,這是對團隊所使用的工業級規模強化學習(RL)訓練框架的詳細介紹。該框架通過創新的數據平面架構,對RL的訓練邏輯和Agent做了徹底解耦,用以支持多智能體、在線強化學習訓練等復雜場景;更進一步,針對RL計算資源分配問題,團隊提出了“標簽分配機制”,統一了該領域最廣泛的兩種設計模式(訓推共卡、訓推分離)。以標簽分配的思路為出發點,在業界首個提出“時空復用pipel...
2025-08-29 16:20:42 1173瀏覽 0點贊 0回復 0收藏
在大語言模型的競爭中,數學與代碼推理能力已經成為最硬核的“分水嶺”。從OpenAI最早將RLHF引入大模型訓練,到DeepSeek提出GRPO算法,我們見證了強化學習在推理模型領域的巨大潛力。然而,想要復現這些頂尖成果,并不只是“多喂點數據、跑幾輪訓練”這么簡單。現實是,很多中小規模的開源推理模型,在AIME這樣的高難數學競賽題、或LiveCodeBench這樣的復雜代碼評測中,依然與閉源SOTA存在明顯差距。最近,快手Klear語言大模型...
2025-08-19 18:15:00 1613瀏覽 0點贊 0回復 0收藏
近日,快手8篇論文入選人工智能數據挖掘領域頂會KDD2025,研究涵蓋推薦系統、多任務學習、多模態大模型、大語言模型、組合優化等前沿領域的成果。KDD(ACMSIGKDDConferenceonKnowledgeDiscoveryandDataMining)是人工智能數據挖掘領域的國際頂級學術會議。該會議一年舉辦一次,由ACM的數據挖掘及知識發現專委會主辦。KDD2025將于2025年8月3日至7日在加拿大舉辦。近日,大會正式公布論文錄取結果,快手憑借在人工智能領域的持續...
2025-08-05 15:49:15 3710瀏覽 0點贊 0回復 0收藏
一、項目背景當前在線推理服務架構中,計算節點(推理服務)與存儲節點(在線PS服務)之間存在海量的實時數據傳輸需求。隨著模型參數量劇增,傳統分布式架構需擴展到成千上萬個服務節點,導致計算節點訪問存儲節點的帶寬散出激增,進而推高訪問延遲。加之當前主流的TCP網絡通信存在CPU占用高、延遲高、吞吐低等劣勢,嚴重制約了服務響應時間,限制了模型預估機器的橫向擴展(ScaleOut)規模。結合快手的業務需求,我們的目標是...
2025-07-23 17:09:07 1545瀏覽 0點贊 0回復 0收藏
近日,快手發布并開源了KATV1自動思考(AutoThink)大模型,這是一款融合思考與非思考能力、并且可以根據問題難度自動切換思考形態的模型。KATV1模型共有40B和200B兩個版本。在自動思考模式下,40B版本的性能可追平今年5月發布的新版DeepSeekR1(參數量為6850億)。而200B版本的模型,則在多項基準測試中超過了Qwen、DeepSeek和Llama這三大開源模型家族中的旗艦模型。值得一提的是,在號稱無法作弊的競賽級實時基準測試LiveCode...
2025-07-22 13:26:26 2375瀏覽 0點贊 0回復 0收藏
導讀:本文以快手天守平臺核心建設者視角,系統梳理了大規模前端工程質量保障體系的演進路徑。通過解構其分層架構設計、分布式調度引擎等關鍵技術組件,深度剖析平臺在應對億級DAU場景下的工程實踐,為行業提供可借鑒的質量保障體系建設范式。??即使你的工廠被拆除了,只要它的精神還在,你就能很快重新建立起另一家。如果一場革命摧毀了舊政府,但新政府思想和行為的系統模式沒有變化,它就仍然難逃再次被推翻的命運。關于系...
2025-07-17 14:27:04 886瀏覽 0點贊 0回復 0收藏
在自然語言處理中,自回歸建模(AutoregressiveModeling,AR)憑借其"NexttokenPrediction"的方式,已在GPT、LLaMA等大語言模型中取得了突破性成果。受此啟發,業界開始將自回歸方法從語言遷移到視覺領域,在圖像生成領域(DALL·E、GPT4o)也表現出了巨大的潛力。相較于基于擴散模型(DiffusionModel)的生成方式,自回歸的方式更加有效地建模多模態信息,同時避免噪聲采樣的隨機性,進而生成更加穩定的結果。為了將自回歸建模...
2025-07-14 17:28:41 3268瀏覽 0點贊 0回復 0收藏
計算機視覺領域頂級會議InternationalConferenceonMachineLearning(ICML2025)將于7月13日至7月19日在加拿大溫哥華召開,快手音視頻技術團隊聯合南京大學發表的題為《UltraLowrateImageCompressionwithSemanticResidualCodingandCompressionawareDiffusion》——基于語義殘差編碼與壓縮感知擴散的超低碼率圖像壓縮的最新研究成果被會議收錄。ICML是機器學習領域的頂級國際會議,其收錄的論文代表了機器學習基礎理論與算法創新的...
2025-07-10 17:32:13 1951瀏覽 0點贊 0回復 0收藏
導讀:快手8篇論文入選機器學習領域頂會ICML2025,研究涵蓋了多模態情感大模型、機器學習單調建模、因果效應估計結果、級聯排序系統一體化建模、統一生成理解框架、圖像壓縮、圖像超分等前沿領域的成果。??ICML(InternationalConferenceonMachineLearning)作為機器學習領域的全球頂級學術盛會,由國際機器學習學會(IMLS)主辦,并被中國計算機學會(CCF)列為A類國際權威會議。第42屆ICML將于7月13日至19日在溫哥華會議中...
2025-07-08 17:05:00 1521瀏覽 0點贊 0回復 0收藏
測試時擴展(TestTimeScaling)極大提升了大語言模型的性能,涌現出了如OpenAIo系列模型和DeepSeekR1等眾多爆款。那么,什么是視覺領域的testtimescaling?又該如何定義??為了回答這一問題,最近香港科技大學聯合快手可靈團隊推出EvolutionarySearch(EvoSearch)方法,通過提高推理時的計算量來大幅提升模型的生成質量,支持圖像和視頻生成,支持目前最先進的diffusionbased和flowbased模型。?EvoSearch無需訓練,無需梯度...
2025-07-03 17:27:56 911瀏覽 0點贊 0回復 0收藏
導讀:快聘業務快速發展情況下,圖文AIGC模板生產人力緊缺,技術借助碼靈D2C和增長合圖能力搭建伏羲工作臺,助力實現業務模板快速自動化生產,推動了業務形態發展。一、背景介紹業務背景“快聘”是快手于2022年推出覆蓋藍領群體的短視頻平臺藍領招聘業務。通過構建以信任為中心的藍領招聘關系和直播帶崗模式,為用工企業和藍領用戶搭建就業平臺。快手“快聘”早期叫“快招工”,進行品牌升級后叫“快聘”,自推出后,已為比亞迪...
2025-06-27 18:04:36 1215瀏覽 0點贊 0回復 0收藏
導讀:近日,快手發布并開源其最新自研的多模態大語言模型KwaiKeyeVL。KwaiKeyVL采用VisionEncoderProjectorLLM架構,集成了文本、圖像、視頻信息的混合輸入處理能力,旨在為用戶帶來更智能、更全面的多模態交互體驗。如果有人突然問你:「這張圖片中有幾顆草莓」?你會如何快速回復?面對五彩繽紛的果盤,我們往往需要反復端詳,放大圖片再逐一清點,耗費不少時間才能得到答案。然而,AI大模型正讓這種復雜視覺識別變得簡單—...
2025-06-27 15:39:52 2263瀏覽 0點贊 0回復 0收藏
導讀:大模型技術正深刻重塑商業風控體系,推動風險管理向智能化、高效化、精準化轉型。本系列專題首篇聚焦快手商業化風控內容審核場景,系統剖析大模型如何破解傳統風控痛點,構建覆蓋全鏈路的風險治理新范式。后續篇章還將進一步揭秘大模型評估標準Bechmark、智能體Agent、多模態推理模型等內容,敬請期待。一、引言快手商業化場景下,風險控制不僅關乎平臺的信譽和經濟效益,更直接影響用戶和客戶的體驗和利益。理想的風控系...
2025-06-25 17:00:32 1823瀏覽 0點贊 0回復 0收藏
近日,快手推薦模型團隊提出了一個端到端生成式推薦系統OneRec,該系統采用EncoderDecoder架構,引入了基于獎勵機制的偏好對齊方法,借助強化學習增強模型效果,可在獎勵模型引導下直接生成契合用戶偏好的視頻內容。通過極致的性能優化,OneRec在推薦模型FLOPs提升10倍的同時,大幅削減了通信和存儲等運營成本近90%。目前,OneRec已在快手快手極速版雙端承接25%的線上流量,帶動APP停留時長分別提升0.54%和1.24%。當生成式架構...
2025-06-20 19:57:58 1.0w瀏覽 0點贊 0回復 0收藏
CVPR(IEEEConferenceonComputerVisionandPatternRecognition)是國際計算機視覺和模式識別領域的頂級學術會議之一。CVPR2025將于6月11日至6月15日在美國田納西州納什維爾舉辦,本屆共收到了13,008篇有效論文提交,最終有2,878篇被接收,整體錄用率約為22.1%。其中,快手共有12篇論文入選CVPR2025,涵蓋視頻質量評估、多模態數據集構建與基準測試、動態3D頭像重建、動態4D場景模擬、視頻生成與增強技術、可控視頻生成與編輯等多...
2025-06-11 11:00:36 1994瀏覽 0點贊 0回復 0收藏
國際計算語言學年會(AnnualMeetingoftheAssociationforComputationalLinguistics,簡稱ACL)是由國際計算語言學協會(AssociationforComputationalLinguistics)主辦的學術盛會,每年舉辦一次。作為計算語言學和自然語言處理領域最具影響力的會議之一,第63屆ACL即將于7月27日至8月1日在奧地利首都維也納隆重舉辦。近日,ACL正式公布了論文錄用名單,快手基礎大模型團隊憑借其在人工智能領域的深厚積累,成功入選7篇論文。這些...
2025-06-05 20:34:36 1512瀏覽 0點贊 0回復 0收藏
導讀:本文回顧了關于快手的核心數據對象“Photo”存儲系統的一次巧妙降本增效的故事。通過充足細致的前期調研分析,以極少的人力投入取得了相當可觀的收益。文中對有巨大UGC歷史數據存量的平臺型公司如何應對挑戰有一些思考和總結。一、引言Prematureoptimizationistherootofallevil(oratleastmostofit)inprogramming.——DonaldKnuth快手作為國民級短視頻平臺,歷史上短視頻的總量已達千億級,每日新增短視頻作品超過4000萬。...
2025-05-29 17:10:58 1111瀏覽 0點贊 0回復 0收藏
?Sora、可靈等視頻生成模型令人驚艷的性能表現使得創作者僅依靠文本輸入就能夠創作出高質量的視頻內容。然而,我們常見的電影片段通常是由導演在一個場景中精心布置多個目標的運動、攝像機拍攝角度后再剪輯而成的。例如,在拍攝賽車追逐的場景時,鏡頭通常跟隨賽車運動,并通過扣人心弦的超車時刻來展示賽事的白熱化。而如今的視頻生成模型無法實現3D場景中目標、相機聯合控制的文本到視頻創作,限制了AI影視制作的能力。近期...
2025-05-27 16:16:18 1201瀏覽 0點贊 0回復 0收藏