2021 8th NAFOSTED Conference on Information and Computer Science (NICS) 2021
DOI: 10.1109/nics54270.2021.9701510
|View full text |Cite
|
Sign up to set email alerts
|

Guided Anchoring Cascade R-CNN: An intensive improvement of R-CNN in Vietnamese Document Detection

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1

Citation Types

0
1
0
1

Year Published

2022
2022
2024
2024

Publication Types

Select...
4
3

Relationship

0
7

Authors

Journals

citations
Cited by 7 publications
(2 citation statements)
references
References 13 publications
0
1
0
1
Order By: Relevance
“…Dựa theo sự phát triển đó, phạm vi của nghiên cứu này là bài toán phát hiện các thành phần quan trọng xuất hiện trong trang tài liệu như "Caption", "Table ", "Figure ", "Formula", ... "Document Image Understanding" (Gao et al, 2017) là một nghiên cứu quan trọng được thực hiện với nhiều vấn đề thách thức, đang nhận được sự quan tâm ngày càng nhiều không chỉ từ các cộng đồng phân tích và ghi nhận tài liệu. Bài toán phát hiện đối tượng trang trong hình ảnh tài liệu (Nguyen et al, 2018;Long và ctv., 2020;Le et al, 2021;Nguyen et al, 2022) vẫn là một thách thức vì các đối tượng trang rất đa dạng về quy mô và tỷ lệ khung hình, và một đối tượng có thể chứa các thành phần gần như tách rời nhau. Do đó, việc rút trích thông tin từ hình ảnh của tài liệu là vô cùng cần thiết, nhiều phương pháp máy học ra đời trong tương lai sẽ giúp con người dễ dàng tìm kiếm những tài liệu cần thiết và tránh mất nhiều thời gian.…”
Section: Giới Thiệuunclassified
“…Dựa theo sự phát triển đó, phạm vi của nghiên cứu này là bài toán phát hiện các thành phần quan trọng xuất hiện trong trang tài liệu như "Caption", "Table ", "Figure ", "Formula", ... "Document Image Understanding" (Gao et al, 2017) là một nghiên cứu quan trọng được thực hiện với nhiều vấn đề thách thức, đang nhận được sự quan tâm ngày càng nhiều không chỉ từ các cộng đồng phân tích và ghi nhận tài liệu. Bài toán phát hiện đối tượng trang trong hình ảnh tài liệu (Nguyen et al, 2018;Long và ctv., 2020;Le et al, 2021;Nguyen et al, 2022) vẫn là một thách thức vì các đối tượng trang rất đa dạng về quy mô và tỷ lệ khung hình, và một đối tượng có thể chứa các thành phần gần như tách rời nhau. Do đó, việc rút trích thông tin từ hình ảnh của tài liệu là vô cùng cần thiết, nhiều phương pháp máy học ra đời trong tương lai sẽ giúp con người dễ dàng tìm kiếm những tài liệu cần thiết và tránh mất nhiều thời gian.…”
Section: Giới Thiệuunclassified
“…In the field of deep learning, object detection methods have mainly evolved from two-stage, 1 3 one-stage, 4 6 and transformer-based object detectors 7 9 A notable example of a two-stage detector is faster R-CNN, 10 which introduced a region proposal network (RPN) and developed an end-to-end detector that significantly improved performance and accelerated inference.…”
Section: Introductionmentioning
confidence: 99%