Integrasi data kini telah menjadi kebutuhan bagi setiap organisasi. Organisasi yang tidak mengintegrasikan data antara satu divisi dengan divisi lainnya akan menimbulkan kemungkinan terjadinya redundansi dan data yang tidak konsisten. Proses integrasi data umumnya terkendala oleh penggunaan istilah dan penulisan nama tabel serta atribut yang berbeda. Dalam penelitian ini, metode Linguistik dikombinasikan dengan metode Constraint digunakan untuk menemukan kesamaan antara atribut database yang berbeda. Metode Bigram digunakan sebagai metode linguistik. Atribut yang diusulkan untuk dihapus oleh Bigram ditinjau kembali dari aspek Constraint. Dengan menggunakan metode ini, 8 tabel dan 60 atribut dapat direduksi dari tujuh database. Hasil penelitian menunjukkan bahwa metode ini mempunyai akurasi di atas 99% pada semua skenario. Di sisi lain, Precision terendah terdapat saat membandingkan atribut antara database Administrasi_siswa dan Kesiswaan, yaitu hanya mencapat 70%. Meskipun masih ada beberapa kesalahan yang dilakukan oleh Bigram sebagai metode Linguistik, kesalahan tersebut dapat ditutupi dengan menggabungkan metode tersebut dengan metode berbasis Constraint. Pengujian validitas hasil integrasi dilakukan dengan query menggunakan sintaks SQL langsung ke database dan menghasilkan hasil query yang benar.
Selama bertahun-tahun database relasional menjadi solusi untuk penyimpanan data sampai datang era Big Data. Kemudian database non-relasional (yang dikenal sebagai sistem database NoSQL) mulai dikembangkan sebagai solusi database yang mempunyai kecepatan tinggi dan scalable untuk menangani volume data yang terus meningkat. Di sisi lain, NoSQL mempunyai beberapa kekurangan, diantaranya : tidak support ACID (Atomicity, Consistency, Isolation, Durability) dan beberapa sistem database NoSQL tidak support SQL. NewSQL merupakan pengembangan dari NoSQL namun mendukung fitur ACID dan SQL.
Ada banyak sistem database NewSQL yang dikembangkan saat ini dengan arsitektur, fitur dan implementasi yang bervariasi. Dalam paper ini, kami mencoba melakukan quick review mengenai perkembangan database mulai dari database relasional yang tradisional, NoSQL hingga NewSQL. Kemudian dideskripsikan satu persatu mengenai sistem database NewSQL yang ada. Pada bagian akhir kami mencoba membandingkan beberapa database NewSQL pada lima aspek, diantaranya : Ease of Use, Features & Functionality, Advanced Features, Integration dan Performance.
Dari hasil perbandingan, pada aspek Ease of Use c-treeACE mendapat nilai tertinggi sedangkan Apache Trafodion menjadi yang terendah. Pada aspek Features & Functionality TIBCO ActiveSpaces menjadi yang tertinggi sedangkan VoltDB mendapat skor terendah. Selanjutnya, Altibase mendapat skor tertinggi pada aspek Advanced Features dan Apache Trafodion kembali menjadi yang terendah. Pada aspek Integration, skor tertinggi ada pada CockroachDB dan terendah ada pada Pivotal GemFire XD. Terakhir, pada aspek Performance, ActorDB menjadi yang tertinggi dan Apache Trafodion menjadi yang terendah lagi.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.