
TOE网络卸载
方案解读
TCP协议的硬件全卸载,降低CPU负载
利用FPGA并行计算优势,降低网络协议处理延时、提升吞吐量
灵活结合业务数据应用的硬件加速
性能规格
处理延时:100ns
支持1~256条TCP连接
应用场景
金融高频交易
数据中心
RDMA
方案解读
零拷贝
无需用户空间和内核空间来回复制数据
内核Bypass
IO(数据)流程绕过内核,即在用户层完成数据的发送和接收,降低对核心资源的消耗
CPU卸载
硬件处理报文封装与解析,无需远端节点CPU参与通信情况下对内存进行读写
性能规格
PCIE3.0X16
高达100Gb/s的总吞吐量
支持100Gb/s InfiniBand ROCEv2和以太网适配器
应用场景
高性能计算(HPC)领域
大型数据中心

Gzip压缩
特性
完全自研,拥有知识产权
符合RFC1951/1952协议
支持静态、动态哈夫曼编码
LZ77滑动窗口为32KB
数据总线位宽为128bits
资源占用
ALM:163K
Mem:28Mbits
吞吐率
Up to 1.3GB/s @150MHz clock
时延
IP latency约为43us
优化进行中 吞吐率期望达到5GB/s 压缩率期望提升10%
压缩率
Average ratio of Calgary is 2.58
测试集 (Calgary) |
原始文件 (Byte) |
RTL压缩后文件 (Byte) |
RTL压缩率 |
bib |
111261 |
46427 |
2.40 |
book1 |
768771 |
370624 |
2.07 |
book2 |
610856 |
258103 |
2.37 |
geo |
102400 |
71180 |
1.44 |
news |
377109 |
170789 |
2.21 |
obj1 |
21504 |
11336 |
1.90 |
obj2 |
246814 |
101496 |
2.43 |
paper1 |
53161 |
22325 |
2.38 |
paper2 |
82199 |
35660 |
2.33 |
paper3 |
46526 |
21005 |
2.21 |
paper4 |
13286 |
6026 |
2.20 |
paper5 |
11954 |
5396 |
2.22 |
paper6 |
38105 |
16008 |
2.38 |
pic |
513216 |
85180 |
6.02 |
progc |
39611 |
16098 |
2.46 |
progl |
71646 |
21701 |
3.30 |
progp |
49379 |
15300 |
3.23 |
trans |
93695 |
29721 |
3.15 |
Average ratio of Silesia is 2.50
测试集 (Silesia) |
原大小 |
压缩后 |
压缩率 |
xml |
5345280 |
1257124 |
4.25 |
x-ray |
8474240 |
6624812 |
1.28 |
webster |
41458703 |
15302744 |
2.71 |
sao |
7251944 |
5955100 |
1.22 |
samba |
21606400 |
7229340 |
2.99 |
reymont |
6627202 |
2440124 |
2.72 |
osdb |
10085684 |
5154324 |
1.96 |
ooffice |
6152192 |
3503764 |
1.76 |
nci |
33553445 |
6148748 |
5.46 |
mr |
9970564 |
4242752 |
2.35 |
mozilla |
51220480 |
22364788 |
2.29 |
dickens |
10192446 |
4703184 |
2.17 |
CNN图像解析加速
支持Caffe/Tensorflow开源环境下直接使用,自动解析网络拓扑和权重文件并自动配置FPGA
特有的设计架构,结构清晰,高通用性,支持大多数CNN网络拓扑
特有的数据流优化,非指令架构,DSP工作频率可达600MHz,利用率达到80%,计算效率接近理论值
特有专利定点化技术(专利已获授权),计算结果精度高,无缝对接单精度浮点数据
自主知识产权,从视频输入到推理结果处理,无CPU介入,全套RTL解决方案,可提供国产化方案



