● 项目详情

TSMC 65nm 低功耗存内计算芯片设计

存算一体架构 · RTL 设计 · 综合与时序优化

2024.06 – 至今 | 核心成员

← 返回主页

项目概述

本项目基于 TSMC 65nm 工艺节点,设计并实现了一款低功耗存内计算(Computing-in-Memory, CIM)芯片。存内计算是一种突破传统冯·诺依曼瓶颈的新型计算范式,通过在存储器内部直接完成计算操作,大幅减少了数据在处理器与存储器之间搬运所带来的功耗与延迟。

核心存储阵列涵盖多种存储单元架构,包括 6T SRAM双端口 SRAM4T eDRAM,以适配不同计算场景对速度、面积与功耗的差异化需求。芯片采用存算一体架构,支持向量矩阵乘法(VMM)的高效硬件加速。

工艺节点
TSMC 65nm
项目周期
2024.06 – 至今
角色
核心成员
芯片类型
CIM 存算一体

技术架构

存内计算(CIM)系统架构
基于 TSMC 65nm 的低功耗存算一体设计

整个 CIM 系统由以下核心模块构成:

  • 存储阵列:集成 6T SRAM(高稳定性)、双端口 SRAM(高吞吐)及 4T eDRAM(高密度)三种存储单元,面向不同数据访问模式灵活调度
  • 计算单元:基于乘法优化算法的 CIM 核心,支持向量矩阵乘法的并行硬件加速,在存储阵列内部完成乘累加(MAC)运算
  • 控制逻辑:RTL 级实现的状态机与微架构控制器,管理数据流调度、存储阵列选通及计算模式切换
  • 系统总线接口:适配 AHB/APB 总线协议的接口模块,实现 CIM 加速器与主处理器的数据交互与寄存器配置
Tiny-vp CIM 存储阵列结构图

▲ Tiny-vp CIM 存储阵列结构图

TSMC 65nm CIM 芯片 Wire Bonding 封装图

▲ TSMC 65nm CIM 芯片 — Wire Bonding 封装实物图

TSMC 65nm CIM 芯片测试板实物图

▲ TSMC 65nm CIM 芯片 — 测试板实物图

我的工作

1. RTL 设计与功能验证
Verilog · TestBench · 仿真
  • 深入分析 CIM 架构下的矩阵乘法运算特性,设计面向存内计算的乘法优化算法,在保证计算精度的前提下显著降低硬件资源开销
  • 独立完成核心计算单元的RTL 级 Verilog 代码设计,包括数据通路、控制状态机及流水线架构的硬件实现
  • 编写完整的 TestBench 仿真验证环境,覆盖功能验证、边界条件测试及随机激励测试,确保 RTL 功能正确性
2. 逻辑综合与时序分析
Synopsys DC · STA · 时序约束
  • 使用 Synopsys Design Compiler (DC) 结合 TSMC 65nm 标准单元库完成逻辑综合,编写并优化时序约束文件(SDC)
  • 结合 静态时序分析(STA)工具进行全芯片时序分析,定位关键路径(Critical Path),通过流水级重划分与逻辑重构实现时序收敛
  • 完成 CIM 模块与系统总线(AHB/APB)的接口适配与时序闭环,确保模块间数据交互满足建立/保持时间要求
3. 流片、封装与板级测试
Tape-out · 封装 · 测试用例
  • 全程参与芯片流片(Tape-out)流程,包括 GDS 交付前检查、DRC/LVS 验证及与 Foundry 的沟通协调
  • 参与芯片封装方案评估与选型,完成从裸片到封装器件的完整交付链路
  • 开发板级测试用例,设计测试向量并搭建 FPGA 辅助测试平台,完成系统级硬件功能验证

关键技术

Verilog RTL Synopsys DC STA TSMC 65nm CIM 存内计算 6T SRAM 双端口 SRAM 4T eDRAM AHB/APB VMM 加速 DRC/LVS Tape-out FPGA 验证

项目成果

🏆

First Time Right — 一次流片成功

芯片流片后经板级测试,各项功能全部正常。在真实硬件平台上成功验证了向量矩阵运算指令,功能指标达到预期设计目标,实现"一次成功"的流片成果。