AMD 推出自家首款小语言模型“Llama-135m”
AMD 推出自家首款小语言模型“Llama-135m”
IT 之家 9 月 29 日消息,AMD 在 Huggingface 平台公布了自家首款 " 小语言模型 "AMD-Llama-135m,该模型具有推测解码功能,拥有 6700 亿个 token,采用 Apache 2.0 开源许可,IT 之家附模型地址如下。
据介绍,这款模型主打 " 推测解码 " 能力,其基本原理是使用小型草稿模型生成一组候选 token,然后由更大的目标模型进行验证。这种方法允许每次前向传递生成多个 token,而不会影响性能,从而显著减少 RAM 占用,实现效率提升。
AMD 表示,这款模型在四个 AMD Instinct MI250 节点训练了六天,其 " 编程专用版本 " 变体 AMD-Llama-135m-code 则额外耗费了四天时间进行微调。
-
- 河南鹤壁通报“职校学生被人用板凳砸头”
-
2024-09-30 17:07:18
-
- 一非法移民船在西班牙加那利群岛倾覆致9死数十人失踪
-
2024-09-30 17:05:02
-
- 无人驾驶赛车“天猿”在湖南株洲首发
-
2024-09-30 17:02:46
-
- 小米明年将进军全球家电市场,首站东南亚
-
2024-09-30 17:00:30
-
- 马自达远程启动功能变付费服务,每月 10 美元
-
2024-09-30 16:58:15
-
- 神仙公司!张雪峰宣布国庆放10天假 9月28日就已经放了
-
2024-09-30 16:55:59
-
- 华为掀起三折叠屏手机创新热潮 多家厂商已开始跟进
-
2024-09-28 13:04:40
-
- 佳能向得克萨斯电子研究所交付其最先进纳米压印光刻 NIL 系统
-
2024-09-28 13:02:24
-
- 民航局:截至今年6月全国实名登记的无人机已达187.5万架
-
2024-09-28 13:00:09
-
- 中国“政策大礼包”引发海外奢侈品股热潮,LVMH和爱马仕涨近10%
-
2024-09-28 12:57:53
-
- 河南周口一收割机在玉米地撞倒铁塔,司机不幸身亡,当地警方已介入调查
-
2024-09-28 12:55:37
-
- 苦战三盘遭逆转!王欣瑜不敌32号种子,遗憾止步无缘中网第3轮
-
2024-09-28 12:53:21
-
- 市场太火热交易软件崩了?国信证券旗下金太阳宕机,客服回应:已修复
-
2024-09-28 12:51:06
-
- 8月中国市场豪华品牌销量TOP10:奔驰第一 理想第二
-
2024-09-28 12:48:50
-
- 哪些豪华进口车卖不动了:保时捷暴跌、雷克萨斯逆势上扬
-
2024-09-28 12:46:35
-
- 苹果再次推出AirPods Pro 2固件更新 带来多项改进
-
2024-09-28 12:44:19
-
- 美籍华裔科学家王安创办的电脑公司媲美IBM的IT企业
-
2024-09-26 11:39:07
-
- 陈姝君背后的故事
-
2024-09-26 11:36:51
-
- 中华女子学院怎么样?有男生吗?
-
2024-09-26 11:34:35
-
- 陈冠希年轻的时候到底有多帅?看完这些就让人一目了然了
-
2024-09-26 11:32:20