Skip to content

Commit 3491997

Browse files
committed
refactor: 349 期发布前整理
1 parent 3e59b53 commit 3491997

File tree

5 files changed

+3
-32
lines changed

5 files changed

+3
-32
lines changed

Reports/2025/#349-2025.09.01.md

Lines changed: 3 additions & 32 deletions
Original file line numberDiff line numberDiff line change
@@ -5,22 +5,8 @@
55

66
你也可以为这个项目出一份力,如果发现有价值的信息、文章、工具等可以到 [Issues](https://github.com/SwiftOldDriver/iOS-Weekly/issues) 里提给我们,我们会尽快处理。记得写上推荐的理由哦。有建议和意见也欢迎到 [Issues](https://github.com/SwiftOldDriver/iOS-Weekly/issues) 提出。
77

8-
## 新闻
9-
10-
> 行业相关的新闻、趣事、看法
11-
12-
##  Developer - 设计开发加速器
13-
14-
> 设计开发加速器相关活动
15-
16-
## 新手推荐
17-
18-
> 收集一些对新手友好且质量不错的文章
19-
208
## 文章
219

22-
> 写的不错的技术博客,包含但不局限于 iOS、多端统一、设计、产品等
23-
2410
### 🐎 [Why I'm Not Using Xcode 26's AI Chat Integration (And What Could Change My Mind)](https://www.fline.dev/why-im-not-using-xcode-26s-ai-chat-integration-and-what-could-change-my-mind/)
2511

2612
[@阿权](https://github.com/bqlin):文章者结合自身开发体验,分析了 Xcode 26 中 AI 集成的不足,并建议 Apple 补齐(作者也是恨铁不成钢啊!):
@@ -56,7 +42,7 @@
5642
| 注意力机制 | MHA(多头注意力) | GQA(分组查询注意力) | 减少显存与计算开销 |
5743
| 长上下文优化 || 滑动窗口注意力(128 token) | 进一步降低长文本推理成本 |
5844
| 归一化层 | LayerNorm | RMSNorm | 简化计算,提升 GPU 训练效率 |
59-
| 推理控制 || 推理强度可调(低/中/高) | 平衡成本与准确率 |
45+
| 推理控制 || 推理强度可调(低 / 中 / 高) | 平衡成本与准确率 |
6046

6147
gpt-oss 与 Qwen3 模型差异较小,在一些特性上各有千秋:
6248

@@ -68,7 +54,7 @@ gpt-oss 与 Qwen3 模型差异较小,在一些特性上各有千秋:
6854
实用价值与局限:
6955

7056
- 优势:MXFP4 优化适配单 GPU(20B 需 16GB 显存,120B 需 80GB 显存),推理强度可调,性能接近闭源模型;
71-
- 局限:幻觉率较高,无训练代码/数据集(仅开源权重与推理代码),未提供基础模型;
57+
- 局限:幻觉率较高,无训练代码 / 数据集(仅开源权重与推理代码),未提供基础模型;
7258
- 未来潜力:随着工具集成成熟,可通过调用外部资源(如搜索引擎)弥补知识遗忘,进一步释放推理能力。
7359

7460
总体而言,gpt-oss 的发布丰富了开源 LLM 生态,为需要本地部署、高推理能力的场景提供了新选择,也为研究 Transformer 架构演进提供了重要参考。
@@ -91,23 +77,8 @@ SwiftUI 引入了 `ConcentricRectangle` 这个新的 API,帮助开发者更
9177

9278
### 🐕 [MNN LLM Chat iOS 流式输出优化实践](https://mp.weixin.qq.com/s/m5J5nLZiPd_yB0y-byyjCg)
9379

94-
[@JonyFang](https://github.com/JonyFang): 本文针对 iOS 应用中部署大语言模型(LLM)时出现的文字流式输出卡顿问题,提出了一套高效的三层优化方案:通过智能流缓冲解决模型输出与 UI 更新的频率不匹配,利用UI更新批处理与节流降低主线程压力,并借助打字机动画渲染增强视觉流畅性。这一方案提升了本地 LLM 应用的交互体验,适合开发高性能 AI 聊天应用的团队参考实践。其开源实现:[MNN GitHub项目 - https://github.com/alibaba/MNN](https://github.com/alibaba/MNN)
95-
96-
## 工具
97-
98-
> 开发过程中常用的工具,及一些新工具的介绍
99-
100-
## 代码
101-
102-
> 库,代码段,开源app
103-
104-
##
105-
106-
> 比较不错的书的推荐和书评
107-
108-
## 音视频
80+
[@JonyFang](https://github.com/JonyFang): 本文针对 iOS 应用中部署大语言模型(LLM)时出现的文字流式输出卡顿问题,提出了一套高效的三层优化方案:通过智能流缓冲解决模型输出与 UI 更新的频率不匹配,利用 UI 更新批处理与节流降低主线程压力,并借助打字机动画渲染增强视觉流畅性。这一方案提升了本地 LLM 应用的交互体验,适合开发高性能 AI 聊天应用的团队参考实践。其开源实现:[MNN GitHub 项目 - https://github.com/alibaba/MNN](https://github.com/alibaba/MNN)
10981

110-
> 比较不错的书的推荐和书评
11182

11283
## 内推
11384

assets/weekly-header/350.jpg

178 KB
Loading

assets/weekly-header/351.jpg

175 KB
Loading

assets/weekly-header/352.jpg

177 KB
Loading

assets/weekly-header/353.jpg

176 KB
Loading

0 commit comments

Comments
 (0)