Proceedings of the 24th Asia and South Pacific Design Automation Conference 2019
DOI: 10.1145/3287624.3287638
|View full text |Cite
|
Sign up to set email alerts
|

Addressing the issue of processing element under-utilization in general-purpose systolic deep learning accelerators

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
2
1

Citation Types

0
14
0
1

Year Published

2019
2019
2022
2022

Publication Types

Select...
4
4

Relationship

1
7

Authors

Journals

citations
Cited by 25 publications
(15 citation statements)
references
References 9 publications
0
14
0
1
Order By: Relevance
“…Не спадає інтерес до створення систем оброблення даних на підставі ООС і в останні роки. Так, наприклад, у роботі [8] автори вказують на потреба удосконалення архітектури ООС для урахування зміни обсягу задіяних обчислювальних комірок при зміні алгоритму оброблення з метою зменшення енергоспоживання, що вимагає власне реконфігурування алгоритму оброблення, у роботі [11] розглянуто удосконалену обчислювальну комірку (процесорний елемент), який орієнтовано на реалізацію частини спеціалізованих обчислень у системі розпізнавання образів, у роботі [15] автори зосередилися на питаннях створення платформи програмування для ООС.…”
Section: ʑ˔˕˖˒unclassified
“…Не спадає інтерес до створення систем оброблення даних на підставі ООС і в останні роки. Так, наприклад, у роботі [8] автори вказують на потреба удосконалення архітектури ООС для урахування зміни обсягу задіяних обчислювальних комірок при зміні алгоритму оброблення з метою зменшення енергоспоживання, що вимагає власне реконфігурування алгоритму оброблення, у роботі [11] розглянуто удосконалену обчислювальну комірку (процесорний елемент), який орієнтовано на реалізацію частини спеціалізованих обчислень у системі розпізнавання образів, у роботі [15] автори зосередилися на питаннях створення платформи програмування для ООС.…”
Section: ʑ˔˕˖˒unclassified
“…Rather than using a single dataflow, several studies have integrated multiple dataflows into an accelerator (with increased hardware cost) and selected the best one according to the layer dimensions [19]- [23]. These approaches usually perform better than the approaches based on a single dataflow.…”
Section: B Related Workmentioning
confidence: 99%
“…Data reuse heavily depends on the convolutional dataflow. There are various approaches to optimize the dataflow: 1) designing an elaborate dataflow [5], [7]- [18], 2) selecting the best dataflow from several candidates [19]- [23], and 3) design space exploration (DSE) [24]- [32]. A fair number of these studies focus on the performance and/or the energy efficiency of the computational components.…”
Section: Introductionmentioning
confidence: 99%
“…Other studies [50], [51] explore optimizing the mapping and scheduling of computations, either statically or dynamically. These features can be implemented in our baseline accelerator by modifying the control logic and module interconnections.…”
Section: Related Workmentioning
confidence: 99%