Beranda » Blog » Data lakehouse Onehouse mendapatkan $35 juta untuk memanfaatkan revolusi GenAI

Data lakehouse Onehouse mendapatkan $35 juta untuk memanfaatkan revolusi GenAI

Diposting pada 27 Juni 2024 oleh admin / Dilihat: 0 kali

Anda hampir tidak dapat melewatkan satu jam pun akhir-akhir ini tanpa membaca tentangnya AI generatif. Mumpung kita masih dalam fase embrio apa beberapa telah melakukan dubbing “mesin uap” dari revolusi industri keempat, tidak ada keraguan bahwa “GenAI” sedang bersiap untuk mentransformasi hampir semua industri — dari keuangan Dan kesehatan ke hukum dan seterusnya.

Dingin aplikasi yang dihadapi pengguna mungkin menarik sebagian besar keriuhan, namun perusahaan-perusahaan yang mendorong revolusi ini saat ini adalah pihak yang paling diuntungkan. Baru bulan ini, pembuat chip Nvidia sebentar menjadi perusahaan paling bernilai di dunia, raksasa senilai $3,3 triliun didorong secara substansial oleh permintaan akan komputasi AI kekuatan.

Namun selain GPU (unit pemrosesan grafis), bisnis juga memerlukan infrastruktur untuk mengelola aliran data — untuk menyimpan, memproses, melatih, menganalisis, dan pada akhirnya, membuka potensi penuh AI.

Salah satu perusahaan yang ingin memanfaatkan hal ini adalah Satu rumahsebuah startup California berusia tiga tahun yang didirikan oleh Vinoth Chandrayang menciptakan sumber terbuka Apache Hudi proyek sambil menjabat sebagai arsitek data di Uber. Hudi membawa manfaat gudang data ke danau datamenciptakan apa yang dikenal sebagai “data lakehouse”, yang memungkinkan dukungan untuk tindakan seperti mengindeks dan melakukan kueri real-time pada kumpulan data besar, baik itu data terstruktur, tidak terstruktur, atau semi terstruktur.

Misalnya, perusahaan e-niaga yang terus mengumpulkan data pelanggan mulai dari pesanan, masukan, dan interaksi digital terkait akan memerlukan sistem untuk menyerap semua data tersebut dan memastikan data tersebut selalu diperbarui, sehingga dapat membantu perusahaan merekomendasikan produk berdasarkan kebutuhan pengguna. aktivitas. Hudi memungkinkan data diserap dari berbagai sumber dengan latensi minimal, dengan dukungan untuk menghapus, memperbarui, dan menyisipkan (“upsert”), yang sangat penting untuk kasus penggunaan data real-time.

Onehouse mengembangkannya dengan data lakehouse yang terkelola sepenuhnya yang membantu perusahaan menerapkan Hudi. Atau, seperti yang dikatakan Chandar, hal ini “memulai penyerapan dan standardisasi data ke dalam format data terbuka” yang dapat digunakan dengan hampir semua alat utama dalam ilmu data, AI, dan ekosistem pembelajaran mesin.

“Onehouse mengabstraksi pembangunan infrastruktur data tingkat rendah, membantu perusahaan AI fokus pada model mereka,” kata Chandra kepada TechCrunch.

Hari ini, Onehouse mengumumkan telah mengumpulkan $35 juta dalam putaran pendanaan Seri B karena membawa dua produk baru ke pasar guna meningkatkan kinerja Hudi dan mengurangi biaya penyimpanan dan pemrosesan cloud.

Turun di rumah danau (data).

Iklan Onehouse di papan iklan London
Iklan Onehouse di papan iklan London.
Kredit Gambar: Satu rumah

Chandra menciptakan Hudi sebagai proyek internal dalam Uber pada tahun 2016, dan sejak menjadi perusahaan ride-hailing menyumbangkan proyeknya kepada Apache Foundation pada tahun 2019, Hudi telah diadopsi oleh seperti AmazonDisney dan Walmart.

Chandra meninggalkan Uber pada tahun 2019, dan, setelah sempat bertugas sebentar di Confluent, mendirikan Onehouse. Startup ini muncul secara sembunyi-sembunyi pada tahun 2022 dengan $8 juta dalam pendanaan awal, dan segera diikuti dengan Putaran Seri A senilai $25 juta. Kedua putaran dipimpin bersama oleh Greylock Partners dan Addition.

Perusahaan-perusahaan VC ini telah bergabung lagi untuk tindak lanjut Seri B, meskipun kali ini, Usaha Kerajinan David Sacks memimpin putaran.

“Data lakehouse dengan cepat menjadi arsitektur standar bagi organisasi yang ingin memusatkan data mereka untuk mendukung layanan baru seperti analitik real-time, ML prediktif, dan GenAI,” kata mitra Craft Ventures Michael Robinson dalam sebuah pernyataan.

Dalam konteksnya, gudang data dan danau data serupa dalam fungsinya sebagai gudang pusat untuk mengumpulkan data. Namun mereka melakukannya dengan cara yang berbeda: Gudang data ideal untuk memproses dan menanyakan data historis dan terstruktur, sedangkan data lake telah muncul sebagai alternatif yang lebih fleksibel untuk menyimpan data mentah dalam jumlah besar dalam format aslinya, dengan dukungan untuk berbagai jenis data. data dan kueri berkinerja tinggi.

Hal ini menjadikan data lake ideal untuk beban kerja AI dan pembelajaran mesin, karena lebih murah untuk menyimpan data mentah yang telah diubah sebelumnya, dan pada saat yang sama, memiliki dukungan untuk kueri yang lebih kompleks karena data dapat disimpan dalam bentuk aslinya.

Namun, kerugiannya adalah serangkaian kompleksitas pengelolaan data yang baru, yang berisiko memperburuk kualitas data mengingat beragamnya jenis dan format data. Hal inilah yang ingin dipecahkan oleh Hudi dengan menghadirkan beberapa fitur utama gudang data ke data lake, seperti transaksi ASAM untuk mendukung integritas dan keandalan data, serta meningkatkan manajemen metadata untuk kumpulan data yang lebih beragam.

Mengonfigurasi saluran data di Onehouse
Mengonfigurasi saluran data di Onehouse.
Kredit Gambar: Satu rumah

Karena ini adalah proyek sumber terbuka, perusahaan mana pun dapat menggunakan Hudi. Sekilas logo di situs web Onehouse mengungkapkan beberapa pengguna yang mengesankan: AWS, Google, Tencent, Disney, Walmart, ByteDance, Uber dan Huawei, dan masih banyak lagi. Namun fakta bahwa perusahaan-perusahaan besar tersebut memanfaatkan Hudi secara internal menunjukkan upaya dan sumber daya yang diperlukan untuk membangunnya sebagai bagian dari pengaturan data lakehouse di lokasi.

“Meskipun Hudi menyediakan fungsionalitas yang kaya untuk menyerap, mengelola, dan mentransformasikan data, perusahaan masih harus mengintegrasikan sekitar setengah lusin alat sumber terbuka untuk mencapai tujuan mereka dalam menciptakan data lakehouse berkualitas produksi,” kata Chandar.

Inilah sebabnya Onehouse menawarkan platform cloud-native yang terkelola sepenuhnya yang menyerap, mengubah, dan mengoptimalkan data dalam waktu singkat.

“Pengguna dapat mengaktifkan dan menjalankan open data lakehouse dalam waktu kurang dari satu jam, dengan interoperabilitas luas dengan semua layanan cloud-native utama, gudang, dan mesin data lake,” kata Chandar.

Perusahaan itu malu-malu menyebutkan nama pelanggan komersialnya, selain pasangan yang terdaftar di dalamnya studi kasusseperti Apna unicorn India.

“Sebagai perusahaan muda, saat ini kami tidak membagikan seluruh daftar pelanggan komersial Onehouse secara publik,” kata Chandra.

Dengan dana segar sebesar $35 juta di bank, Onehouse kini memperluas platformnya dengan alat gratis yang disebut Onehouse LakeView, yang menyediakan kemampuan observasi ke dalam fungsi rumah danau untuk mendapatkan wawasan tentang statistik tabel, tren, ukuran file, riwayat garis waktu, dan banyak lagi. Hal ini dibangun berdasarkan metrik observabilitas yang disediakan oleh proyek inti Hudi, sehingga memberikan konteks tambahan pada beban kerja.

“Tanpa LakeView, pengguna perlu menghabiskan banyak waktu untuk menafsirkan metrik dan memahami secara mendalam keseluruhan tumpukan untuk menjadi penyebab utama masalah kinerja atau inefisiensi dalam konfigurasi saluran pipa,” kata Chandra. “LakeView mengotomatiskan hal ini dan memberikan peringatan email tentang tren baik atau buruk, menandai kebutuhan manajemen data untuk meningkatkan kinerja kueri.”

Selain itu, Onehouse juga meluncurkan produk baru bernama Table Optimizer, layanan cloud terkelola yang mengoptimalkan tabel yang ada untuk mempercepat penyerapan dan transformasi data.

‘Terbuka dan dapat dioperasikan’

Tidak ada yang bisa mengabaikan segudang pemain nama besar lainnya di luar angkasa. Itu seperti Databricks dan Kepingan Salju semakin meningkat menganut paradigma rumah danau: Awal bulan ini, Databricks dilaporkan membagikan $1 miliar untuk mengakuisisi perusahaan bernama Tabular, dengan tujuan menciptakan standar rumah danau yang umum.

Onehouse sudah pasti memasuki pasar yang panas, namun diharapkan bahwa fokusnya pada sistem “terbuka dan dapat dioperasikan” yang membuatnya lebih mudah untuk menghindari vendor lock-in akan membantunya bertahan dalam ujian waktu. Hal ini pada dasarnya menjanjikan kemampuan untuk membuat satu salinan data dapat diakses secara universal dari mana saja, termasuk layanan asli Databricks, Snowflake, Cloudera, dan AWS, tanpa harus membangun silo data terpisah pada masing-masing layanan.

Seperti halnya Nvidia di bidang GPU, peluang yang menanti perusahaan mana pun di bidang manajemen data tidak dapat diabaikan. Data adalah landasannya pengembangan AI, dan kurangnya data berkualitas baik adalah alasan utamanya mengapa banyak proyek AI gagal. Bahkan ketika data sudah tersedia dalam jumlah besar, perusahaan masih memerlukan infrastruktur untuk menyerap, mentransformasi, dan melakukan standarisasi agar data tersebut berguna. Itu menjadi pertanda baik bagi Onehouse dan sejenisnya.

“Dari sisi pengelolaan dan pemrosesan data, saya percaya bahwa data berkualitas yang dihasilkan oleh fondasi infrastruktur data yang kuat akan memainkan peran penting dalam menjadikan proyek-proyek AI ini menjadi kasus penggunaan produksi di dunia nyata — untuk menghindari masuk/keluarnya sampah. masalah data,” kata Chandra. “Kami mulai melihat permintaan seperti itu di kalangan pengguna data lakehouse, karena mereka kesulitan untuk menskalakan pemrosesan data dan kebutuhan kueri untuk membangun aplikasi AI yang lebih baru pada data skala perusahaan.”

Bagikan ke

Data lakehouse Onehouse mendapatkan $35 juta untuk memanfaatkan revolusi GenAI

Saat ini belum tersedia komentar.

Silahkan tulis komentar Anda

Alamat email Anda tidak akan kami publikasikan. Kolom bertanda bintang (*) wajib diisi.

*

*

Data lakehouse Onehouse mendapatkan $35 juta untuk memanfaatkan revolusi GenAI

Chat via Whatsapp

Ada yang ditanyakan?
Klik untuk chat dengan customer support kami

Iffah
● online
Iffah
● online
Halo, perkenalkan saya Iffah
baru saja
Ada yang bisa saya bantu?
baru saja

Produk yang sangat tepat, pilihan bagus..!

Berhasil ditambahkan ke keranjang belanja
Lanjut Belanja
Checkout
Produk Quick Order

Pemesanan dapat langsung menghubungi kontak dibawah: