找回密码
 立即注册
查看: 420|回复: 19

FPGA硬件加速

[复制链接]

2

主题

21

回帖

87

积分

少年

积分
87
发表于 2025-3-16 18:35:53 | 显示全部楼层 |阅读模式
师兄们使用的是Xilinx官方的Vitis AI进行深度模型部署。但是导师期望我能够使用其他方式进行,经过一段时间的了解,决定使用ZYNQ系列进行实现,想把部分功能用放在PL端实现,不知道该方式的可行性。希望各位大佬给出一点建议。

1

主题

6

回帖

33

积分

娃娃

积分
33
发表于 2025-3-16 20:35:43 | 显示全部楼层
支持支持!

6

主题

108

回帖

285

积分

壮年

积分
285
发表于 2025-3-16 23:13:35 | 显示全部楼层
首先就得看你算法哪部分慢,这部分是否支持加速

16

主题

90

回帖

328

积分

管理员

积分
328
发表于 2025-3-16 23:24:04 | 显示全部楼层
你想用ZYNQ做AI 可能得提前放弃,因为资源和算例就不太支持你这么做。
你师兄用Versal是对的,有钱的主
ZYNQ 如果是Z7的花不可行
MPSOC可以看看,几年前我们用ZCU102也是做过实时tiny yolo的

2

主题

21

回帖

87

积分

少年

积分
87
 楼主| 发表于 2025-3-17 10:18:30 | 显示全部楼层
CrazyBingo 发表于 2025-3-16 23:24
你想用ZYNQ做AI 可能得提前放弃,因为资源和算例就不太支持你这么做。
你师兄用Versal是对的,有钱的主
ZYN ...

好的佬,手边有MPSOC的板子,我了解下,实在不行,我还是加入师兄

16

主题

90

回帖

328

积分

管理员

积分
328
发表于 2025-3-17 10:22:19 | 显示全部楼层
琴是晴天的情 发表于 2025-3-17 10:18
好的佬,手边有MPSOC的板子,我了解下,实在不行,我还是加入师兄

你有机会玩versal就狠狠抓住 不是谁都玩得起的

2

主题

21

回帖

87

积分

少年

积分
87
 楼主| 发表于 2025-3-17 10:22:20 | 显示全部楼层
xxppno1 发表于 2025-3-16 23:13
首先就得看你算法哪部分慢,这部分是否支持加速

你好,没搞太懂,会有不支持加速的部分么。按我的理解,如果是整个主干网络的特征提取部分,应该都能拿来加速的。

6

主题

108

回帖

285

积分

壮年

积分
285
发表于 2025-3-17 10:27:43 | 显示全部楼层
琴是晴天的情 发表于 2025-3-17 10:22
你好,没搞太懂,会有不支持加速的部分么。按我的理解,如果是整个主干网络的特征提取部分,应该都能拿来 ...

比如这个算法的输入需要运算结果的输出进行迭代,这时就无法进行流水线了.fpga就没有优势了,毕竟fpga只能跑200M多

2

主题

21

回帖

87

积分

少年

积分
87
 楼主| 发表于 2025-3-17 10:29:56 | 显示全部楼层
CrazyBingo 发表于 2025-3-17 10:22
你有机会玩versal就狠狠抓住 不是谁都玩得起的

主要是老师不太想用商用框架来用在项目上,前面也是在探索有没有其他方式,我也尝试用纯verilog语言的写过一个小模型,开的并行太多,资源消耗太大,只能进行仿真严重,完全没办法下板子,所以才想到用ZYNQ把大部分功能放在PS端来做,把一写操作丢到PL端来做,也是勉强实现他的要求。我也很想跟着师兄用versal

6

主题

108

回帖

285

积分

壮年

积分
285
发表于 2025-3-17 10:31:25 | 显示全部楼层
琴是晴天的情 发表于 2025-3-17 10:22
你好,没搞太懂,会有不支持加速的部分么。按我的理解,如果是整个主干网络的特征提取部分,应该都能拿来 ...

我自己感觉哈,fpga适合那种没有反馈的,批量运算.
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|CrazyFPGA ( 粤ICP备2023025753号 )

GMT+8, 2025-4-1 06:44 , Processed in 0.052421 second(s), 20 queries .

Powered by CrazyFPGA X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表