‪Zhuoming Chen‬ - ‪Google Scholar‬

Eigenes Profil erstellen

Zitiert von

	Alle	Seit 2019
Zitate	171	171
h-index	4	4
i10-index	3	3

0

160

80

40

120

2023202421 150

Koautoren

Zhihao JiaAssistant Professor of Computer Science, Carnegie Mellon UniversityBestätigte E-Mail-Adresse bei cmu.edu
Beidi ChenCarnegie Mellon UniversityBestätigte E-Mail-Adresse bei andrew.cmu.edu
Zhihao ZhangCSD, Carnegie Mellon UniversityBestätigte E-Mail-Adresse bei andrew.cmu.edu
Jingji ChenPurdue UniversityBestätigte E-Mail-Adresse bei purdue.edu

Zhuoming Chen

Zhuoming Chen

PhD student, Carnegie Mellon University

Bestätigte E-Mail-Adresse bei andrew.cmu.edu

Computer Systems Machine Learning


Titel Nach Zitationen sortieren Nach Jahr sortieren Nach Titel sortieren	Zitiert von Zitiert von	Jahr
Specinfer: Accelerating large language model serving with tree-based speculative inference and verification X Miao, G Oliaro, Z Zhang, X Cheng, Z Wang, Z Zhang, RYY Wong, A Zhu, ... Proceedings of the 29th ACM International Conference on Architectural …, 2024	123	2024
Quantized training of gradient boosting decision trees Y Shi, G Ke, Z Chen, S Zheng, TY Liu Advances in neural information processing systems 35, 18822-18833, 2022	17	2022
Sequoia: Scalable, Robust, and Hardware-aware Speculative Decoding Z Chen, A May, R Svirschevski, Y Huang, M Ryabinin, Z Jia, B Chen arXiv preprint arXiv:2402.12374, 2024	13	2024
TriForce: Lossless Acceleration of Long Sequence Generation with Hierarchical Speculative Decoding H Sun, Z Chen, X Yang, Y Tian, B Chen arXiv preprint arXiv:2404.11912, 2024	9	2024
GNNPipe: Scaling Deep GNN Training with Pipelined Model Parallelism J Chen, Z Chen, X Qian arXiv preprint arXiv:2308.10087, 2023	3*	2023
MagicDec: Breaking the Latency-Throughput Tradeoff for Long Context Generation with Speculative Decoding J Chen, V Tiwari, R Sadhukhan, Z Chen, J Shi, IEH Yen, B Chen arXiv preprint arXiv:2408.11049, 2024	2	2024
Sirius: Contextual Sparsity with Correction for Efficient LLMs Y Zhou, Z Chen, Z Xu, V Lin, B Chen arXiv preprint arXiv:2409.03856, 2024	1	2024
MINI-SEQUENCE TRANSFORMER: Optimizing Intermediate Memory for Long Sequences Training C Luo, J Zhao, Z Chen, B Chen, A Anandkumar arXiv preprint arXiv:2407.15892, 2024	1	2024
SpecExec: Massively Parallel Speculative Decoding for Interactive LLM Inference on Consumer Devices R Svirschevski, A May, Z Chen, B Chen, Z Jia, M Ryabinin arXiv preprint arXiv:2406.02532, 2024	1	2024
Quark: A Gradient-Free Quantum Learning Framework for Classification Tasks Z Zhang, Z Chen, H Huang, Z Jia	1	2022
MagicPIG: LSH Sampling for Efficient LLM Generation Z Chen, R Sadhukhan, Z Ye, Y Zhou, J Zhang, N Nolte, Y Tian, M Douze, ... arXiv preprint arXiv:2410.16179, 2024		2024

Das System kann den Vorgang jetzt nicht ausführen. Versuchen Sie es später erneut.

Artikel 1–11