Folgen
Mengdi Wu
Mengdi Wu
Bestätigte E-Mail-Adresse bei andrew.cmu.edu
Titel
Zitiert von
Zitiert von
Jahr
Finding the task-optimal low-bit sub-distribution in deep neural networks
R Dong, Z Tan, M Wu, L Zhang, K Ma
International Conference on Machine Learning, 5343-5359, 2022
112022
FlexLLM: A System for Co-Serving Large Language Model Inference and Parameter-Efficient Finetuning
X Miao, G Oliaro, X Cheng, M Wu, C Unger, Z Jia
arXiv preprint arXiv:2402.18789, 2024
12024
GraphPipe: Improving Performance and Scalability of DNN Training with Graph Pipeline Parallelism
B Jeon, M Wu, S Cao, S Kim, S Park, N Aggarwal, C Unger, D Arfeen, ...
arXiv preprint arXiv:2406.17145, 2024
2024
A Multi-Level Superoptimizer for Tensor Programs
M Wu, X Cheng, O Padon, Z Jia
arXiv preprint arXiv:2405.05751, 2024
2024
Das System kann den Vorgang jetzt nicht ausführen. Versuchen Sie es später erneut.
Artikel 1–4