5
5
6
6
你也可以为这个项目出一份力,如果发现有价值的信息、文章、工具等可以到 [ Issues] ( https://github.com/SwiftOldDriver/iOS-Weekly/issues ) 里提给我们,我们会尽快处理。记得写上推荐的理由哦。有建议和意见也欢迎到 [ Issues] ( https://github.com/SwiftOldDriver/iOS-Weekly/issues ) 提出。
7
7
8
- ## 新闻
9
-
10
- > 行业相关的新闻、趣事、看法
11
-
12
- ## Developer - 设计开发加速器
13
-
14
- > 设计开发加速器相关活动
15
-
16
- ## 新手推荐
17
-
18
- > 收集一些对新手友好且质量不错的文章
19
-
20
8
## 文章
21
9
22
- > 写的不错的技术博客,包含但不局限于 iOS、多端统一、设计、产品等
23
-
24
10
### 🐎 [ Why I'm Not Using Xcode 26's AI Chat Integration (And What Could Change My Mind)] ( https://www.fline.dev/why-im-not-using-xcode-26s-ai-chat-integration-and-what-could-change-my-mind/ )
25
11
26
12
[ @阿权] ( https://github.com/bqlin ) :文章者结合自身开发体验,分析了 Xcode 26 中 AI 集成的不足,并建议 Apple 补齐(作者也是恨铁不成钢啊!):
56
42
| 注意力机制 | MHA(多头注意力) | GQA(分组查询注意力) | 减少显存与计算开销 |
57
43
| 长上下文优化 | 无 | 滑动窗口注意力(128 token) | 进一步降低长文本推理成本 |
58
44
| 归一化层 | LayerNorm | RMSNorm | 简化计算,提升 GPU 训练效率 |
59
- | 推理控制 | 无 | 推理强度可调(低/中/ 高) | 平衡成本与准确率 |
45
+ | 推理控制 | 无 | 推理强度可调(低 / 中 / 高) | 平衡成本与准确率 |
60
46
61
47
gpt-oss 与 Qwen3 模型差异较小,在一些特性上各有千秋:
62
48
@@ -68,7 +54,7 @@ gpt-oss 与 Qwen3 模型差异较小,在一些特性上各有千秋:
68
54
实用价值与局限:
69
55
70
56
- 优势:MXFP4 优化适配单 GPU(20B 需 16GB 显存,120B 需 80GB 显存),推理强度可调,性能接近闭源模型;
71
- - 局限:幻觉率较高,无训练代码/ 数据集(仅开源权重与推理代码),未提供基础模型;
57
+ - 局限:幻觉率较高,无训练代码 / 数据集(仅开源权重与推理代码),未提供基础模型;
72
58
- 未来潜力:随着工具集成成熟,可通过调用外部资源(如搜索引擎)弥补知识遗忘,进一步释放推理能力。
73
59
74
60
总体而言,gpt-oss 的发布丰富了开源 LLM 生态,为需要本地部署、高推理能力的场景提供了新选择,也为研究 Transformer 架构演进提供了重要参考。
@@ -91,23 +77,8 @@ SwiftUI 引入了 `ConcentricRectangle` 这个新的 API,帮助开发者更
91
77
92
78
### 🐕 [ MNN LLM Chat iOS 流式输出优化实践] ( https://mp.weixin.qq.com/s/m5J5nLZiPd_yB0y-byyjCg )
93
79
94
- [ @JonyFang ] ( https://github.com/JonyFang ) : 本文针对 iOS 应用中部署大语言模型(LLM)时出现的文字流式输出卡顿问题,提出了一套高效的三层优化方案:通过智能流缓冲解决模型输出与 UI 更新的频率不匹配,利用UI更新批处理与节流降低主线程压力,并借助打字机动画渲染增强视觉流畅性。这一方案提升了本地 LLM 应用的交互体验,适合开发高性能 AI 聊天应用的团队参考实践。其开源实现:[ MNN GitHub项目 - https://github.com/alibaba/MNN ] ( https://github.com/alibaba/MNN ) 。
95
-
96
- ## 工具
97
-
98
- > 开发过程中常用的工具,及一些新工具的介绍
99
-
100
- ## 代码
101
-
102
- > 库,代码段,开源app
103
-
104
- ## 书
105
-
106
- > 比较不错的书的推荐和书评
107
-
108
- ## 音视频
80
+ [ @JonyFang ] ( https://github.com/JonyFang ) : 本文针对 iOS 应用中部署大语言模型(LLM)时出现的文字流式输出卡顿问题,提出了一套高效的三层优化方案:通过智能流缓冲解决模型输出与 UI 更新的频率不匹配,利用 UI 更新批处理与节流降低主线程压力,并借助打字机动画渲染增强视觉流畅性。这一方案提升了本地 LLM 应用的交互体验,适合开发高性能 AI 聊天应用的团队参考实践。其开源实现:[ MNN GitHub 项目 - https://github.com/alibaba/MNN ] ( https://github.com/alibaba/MNN ) 。
109
81
110
- > 比较不错的书的推荐和书评
111
82
112
83
## 内推
113
84
0 commit comments