Umum
T: Apa itu Amazon Transcribe?
Amazon Transcribe adalah layanan Kecerdasan Buatan (AI) AWS yang memudahkan Anda mengonversi ucapan ke teks. Dengan teknologi Pengenalan Ucapan Otomatis (ASR), Anda dapat menggunakan Amazon Transcribe untuk berbagai aplikasi bisnis, termasuk transkripsi panggilan layanan pelanggan berbasis suara, pembuatan subtitle pada konten audio/video, dan melakukan analisis konten (berbasis teks) pada konten audio/video.
Q: Bagaimana cara Amazon Transcribe berinteraksi dengan produk AWS lainnya?
Amazon Transcribe mengonversi input audio menjadi teks, yang dapat membuka pintu bagi berbagai aplikasi analitik teks pada input suara. Misalnya, dengan Amazon Comprehend pada data teks yang dikonversi dari Amazon Transcribe, Anda dapat melakukan analisis sentimen atau mengekstraksi entitas dan frasa kunci. Demikian pula, melalui berintegrasi dengan Amazon Translate dan Amazon Polly, Anda dapat menerima input suara dalam satu bahasa, menerjemahkannya ke dalam bahasa lain, dan menghasilkan output suara, yang secara efektif memungkinkan percakapan multibahasa. Hal ini juga memungkinkan untuk mengintegrasikan Amazon Transcribe dengan Amazon Kendra atau Amazon OpenSearch untuk mengindeks dan melakukan pencarian berbasis teks di pustaka audio/video. Untuk mempelajari selengkapnya, buka solusi Analitik Panggilan Langsung dan Bantuan Agen, Analitik Pascapanggilan, MediaSearch, atau Analisis Konten.
T: Apa lagi yang harus saya ketahui sebelum menggunakan Amazon Transcribe?
Amazon Transcribe didesain untuk menangani beragam karakteristik ucapan dan suara, termasuk variasi volume, nada, dan kecepatan bicara. Kualitas dan konten sinyal audio (termasuk, tetapi tidak terbatas pada faktor-faktor seperti kebisingan latar belakang, penutur yang berbicara bersamaan, ucapan beraksen, atau peralihan antarbahasa dalam satu file audio) dapat memengaruhi akurasi output layanan. Kami terus memperbarui layanan untuk meningkatkan kemampuannya mengakomodasi variasi akustik tambahan dan jenis konten.
Menggunakan Amazon Transcribe
T: Bagaimana cara developer mengakses Amazon Transcribe?
Cara termudah untuk memulai adalah dengan mengirimkan tugas menggunakan konsol untuk mentranskripsi file audio. Anda juga dapat memanggil layanan secara langsung dari AWS Command Line Interface atau menggunakan salah satu SDK yang didukung pilihan Anda untuk berintegrasi dengan aplikasi Anda. Bagaimanapun juga, Anda dapat mulai menggunakan Amazon Transcribe untuk menghasilkan transkrip otomatis untuk file audio Anda hanya dengan beberapa baris kode.
T: Apakah Amazon Transcribe mendukung transkripsi real-time?
Ya. Amazon Transcribe memungkinkan Anda membuka stream dua arah melalui HTTP2. Anda dapat mengirimkan aliran audio ke layanan dan menerima stream teks yang akan Anda dapatkan secara waktu nyata. Lihat halaman dokumentasi untuk detail selengkapnya.
Q: Encoding apa yang didukung oleh transkripsi waktu nyata?
Tipe media yang didukung dalam transkripsi batch berbeda dengan transkripsi aliran. Meskipun demikian, format nirlesap (lossless) disarankan untuk keduanya. Lihat halaman dokumentasi untuk detail selengkapnya.
T: Bahasa apa yang didukung oleh Amazon Transcribe?
Untuk informasi mengenai dukungan bahasa, lihat halaman dokumentasi ini.
T: Perangkat apa yang berfungsi dengan Amazon Transcribe?
Amazon Transcribe sebagian besar bersifat agnostik perangkat. Secara umum, Amazon Transcribe bekerja dengan perangkat apa pun yang terpasang mikrofon pada perangkat seperti telepon, PC, tablet, dan perangkat IoT (misalnya, sistem audio mobil). API Amazon Transcribe akan mendeteksi kualitas stream audio yang diinput pada perangkat (8kHz VS 16kHz) dan dengan tepat memilih model suara untuk mengonversi ucapan ke teks. Selain itu, developer dapat memanggil API Amazon Transcribe melalui aplikasi mereka untuk mengakses kemampuan konversi ucapan ke teks.
T: Apakah terdapat batasan ukuran pada konten audio yang dapat diproses oleh Amazon Transcribe?
Panggilan layanan Amazon Transcribe dibatasi hingga empat jam (atau 2 GB) per panggilan API untuk layanan batch kami. Layanan streaming dapat mengakomodasi koneksi terbuka hingga empat jam.
T: Bahasa pemrograman apa saja yang didukung Amazon Transcribe?
Layanan batch Amazon Transcribe mendukung .NET, Go, Java, JavaScript, PHP, Python, dan Ruby. Layanan waktu nyata Amazon Transcribe mendukung Java SDK, Ruby SDK, dan C++ SDK. Dukungan SDK tambahan akan segera tersedia. Untuk detail selengkapnya, kunjungi halaman Sumber Daya dan halaman dokumentasi.
T: Kata-kata dalam kosakata kustom saya tidak dikenali. Apa yang dapat saya lakukan?
Keluaran pengenalan ucapan bergantung pada sejumlah faktor selain entri kosakata khusus, sehingga tidak ada jaminan bahwa jika suatu istilah disertakan dalam kosakata khusus, istilah tersebut akan dikenali dengan benar. Namun, salah satu alasan paling sering terjadinya hal ini adalah pengucapan kata-kata yang sangat berbeda dengan penulisannya.
Dalam kasus ini, disarankan untuk membuat beberapa entri frasa dalam file kosakata khusus untuk kata yang sama guna menutupi kemungkinan variasi dalam pengucapan. Anda dapat menggunakan kolom DisplayAs untuk keluaran yang diinginkan untuk entri frasa ini. Lihat dokumentasi kosakata kustom untuk informasi selengkapnya.
T: Mengapa saya menemukan banyak sekali kata-kata kustom di output saya?
Kosakata kustom dioptimalkan untuk daftar kecil kata-kata yang ditargetkan; kosakata yang lebih besar dapat menyebabkan pembuatan kata-kata kustom yang berlebihan, terutama ketika kosakata tersebut mengandung kata-kata yang diucapkan dengan cara serupa. Jika Anda memiliki daftar besar, cobalah menguranginya menjadi kata-kata langka dan kata-kata yang sebenarnya diharapkan terjadi pada file audio Anda. Jika Anda memiliki banyak kosakata yang mencakup beberapa kasus penggunaan, bagi menjadi daftar terpisah untuk berbagai kasus penggunaan. Kata-kata yang pendek dan terdengar mirip dengan kata-kata lain dapat menyebabkan pembuatan yang berlebihan (terlalu banyak kata-kata kustom yang muncul di output). Disarankan untuk menggabungkan kata-kata tersebut dengan kata-kata di sekitarnya dan membuat daftarnya berdasarkan frasa yang dipisahkan oleh tanda hubung. Misalnya, kata kustom “A.D.” dapat dimasukkan sebagai bagian dari frasa seperti “A.D.-converter.”
T: Saat menggunakan formulir DisplayAs, bisakah saya menampilkan kumpulan karakter yang tidak terkait dengan bahasa asli yang ditranskripsikan (misalnya, menampilkan “Jalan” sebagai “街道“)?
Ya. Meskipun frasa hanya boleh menggunakan set karakter terbatas untuk bahasa tertentu, karakter UTF-8 selain \t (TAB) diizinkan di kolom DisplayAs.
T: Apakah redaksi konten otomatis atau redaksi informasi pengenal pribadi (PII) tersedia untuk API batch dan streaming untuk Transcribe?
Ya, Amazon Transcribe mendukung redaksi konten otomatis atau redaksi PII untuk API batch dan streaming.
T: Bahasa apa yang didukung untuk redaksi konten otomatis/identifikasi dan redaksi PII?
Lihat dokumentasi Amazon Transcribe untuk informasi mengenai ketersediaan bahasa redaksi konten otomatis/redaksi PII.
T: Apakah redaksi konten Otomatis juga meredaksi informasi pribadi yang sensitif dari audio sumber?
Tidak, fitur ini tidak akan menghapus informasi pribadi yang sensitif dari audio sumber. Namun, Analitik Panggilan Amazon Transcribe akan menghapus informasi pribadi yang sensitif dari transkrip dan audio sumber. Kunjungi tautan ini untuk detail selengkapnya mengenai cara analitik panggilan dapat meredaksi audio. Anda juga dapat meredaksi informasi pribadi dari audio sumber Anda sendiri menggunakan tanda waktu mulai dan akhir yang disediakan dalam transkrip dan diredaksi untuk setiap instans ungkapan PII yang teridentifikasi. Lihat solusi redaksi audio ini untuk API Transcribe standar.
Namun, API Analitik Panggilan Amazon Transcribe khusus akan menghapus informasi pribadi yang sensitif dari transkrip dan audio sumber. Untuk mempelajari selengkapnya, tinjau dokumentasi redaksi audio Analitik Panggilan.
T: Dapatkah saya menggunakan redaksi konten otomatis untuk meredaksi informasi pribadi dari transkrip teks yang sudah ada?
Tidak, redaksi konten otomatis hanya berkerja pada audio sebagai input.
T: Apa saja yang perlu saya ketahui sebelum menggunakan redaksi konten otomatis?
Redaksi konten otomatis dirancang untuk mengidentifikasi dan menghapus informasi pengenal pribadi (PII), tetapi karena sifat prediktif dari machine learning, redaksi konten ini mungkin tidak akan mengidentifikasi dan menghapus semua instans PII dalam transkrip yang dihasilkan oleh layanan. Anda harus meninjau segala output yang disediakan oleh redaksi konten Otomatis untuk memastikan output memenuhi kebutuhan Anda.
T: Apakah terdapat perbedaan antara redaksi konten otomatis untuk API streaming dan batch?
Ya, terdapat dua kemampuan tambahan yang didukung oleh redaksi konten otomatis untuk API streaming yang tidak didukung oleh API batch. Anda dapat memilih untuk hanya mengidentifikasi PII dan tidak meredaksi saat menggunakan redaksi konten dengan API streaming. Anda juga memiliki kemampuan untuk mengidentifikasi atau meredaksi tipe PII spesifik dengan API streaming. Misalnya, Anda dapat meredaksi nomor keamanan sosial dan informasi kartu kredit saja serta mempertahankan PII lain seperti nama dan alamat email.
T: Wilayah AWS mana yang menyediakan redaksi konten otomatis atau redaksi PII?
Lihat dokumentasi Amazon Transcribe untuk informasi mengenai ketersediaan redaksi konten otomatis dan redaksi PII untuk API batch dan streaming di Wilayah AWS.
T: API mana yang mendukung identifikasi bahasa otomatis?
Identifikasi bahasa otomatis saat ini didukung untuk API batch dan streaming.
T: Bahasa apa yang dapat diidentifikasi secara otomatis oleh Amazon Transcribe?
Amazon Transcribe dapat mengidentifikasi bahasa apa pun yang didukung oleh API batch dan streaming. Buka ini untuk detail mengenai bahasa yang didukung dan fitur khusus bahasa.
T: Apakah Amazon Transcribe akan mengidentifikasi beberapa bahasa dalam file audio yang sama?
Amazon Transcribe mendukung ID multibahasa untuk batch. Buka tautan ini untuk detail selengkapnya.
T: Apakah ada cara untuk membatasi daftar bahasa yang dapat dipilih untuk identifikasi bahasa otomatis?
Ya, Anda dapat menentukan daftar bahasa yang mungkin ada dalam pustaka media Anda. Ketika Anda memberikan daftar bahasa, bahasa yang diidentifikasi akan dipilih dari daftar tersebut. Jika tidak ada bahasa yang ditentukan, sistem akan memproses file audio dengan semua bahasa yang didukung oleh Amazon Transcribe dan memilih yang paling memungkinkan. Akurasi identifikasi bahasa menjadi lebih baik jika daftar bahasa pilihan diberikan. Buka tautan ini untuk detail selengkapnya.
Harga dan ketersediaan
T: Berapa biayanya?
Lihat halaman Harga Amazon Transcribe untuk mempelajari selengkapnya.
T: Di wilayah AWS mana Amazon Transcribe tersedia?
Lihat ke Tabel Wilayah Infrastruktur Global AWS. Buka ini untuk detail tambahan mengenai titik akhir dan kuota Amazon Transcribe.
Privasi Data
T. Apakah input suara yang diproses oleh Amazon Transcribe disimpan, dan bagaimana input suara tersebut digunakan oleh AWS?
Amazon Transcribe dapat menyimpan dan menggunakan input suara yang diproses oleh layanan semata-mata untuk memberikan dan memelihara layanan serta untuk meningkatkan dan mengembangkan kualitas Amazon Transcribe dan teknologi pembelajaran mesin/kecerdasan buatan Amazon lainnya. Penggunaan konten Anda penting untuk peningkatan terus-menerus pengalaman pelanggan Amazon Transcribe Anda, termasuk pengembangan dan pelatihan teknologi terkait. Kami tidak menggunakan informasi pengenal pribadi apa pun yang mungkin terkandung dalam konten Anda untuk menargetkan produk, layanan, atau pemasaran kepada Anda atau pengguna akhir Anda. Kepercayaan, privasi, dan keamanan konten Anda adalah prioritas utama kami, dan kami menerapkan kontrol teknis dan fisik yang sesuai dan canggih, termasuk enkripsi saat istirahat dan dalam perjalanan, yang dirancang untuk mencegah akses tidak sah ke, atau pengungkapan, konten Anda dan memastikan bahwa penggunaan kami sesuai dengan komitmen kami kepada Anda. Lihat https://thinkwithwp.com/compliance/data-privacy-faq/ untuk informasi selengkapnya. Anda dapat memilih untuk tidak menggunakan konten Anda untuk meningkatkan dan mengembangkan kualitas Amazon Transcribe dan teknologi machine learning/kecerdasan buatan Amazon lainnya dengan menggunakan kebijakan tidak ikut serta (opt-out) AWS Organizations. Untuk informasi mengenai cara memilih untuk tidak menggunakan konten, lihat Kebijakan tidak ikut serta layanan AI.
T: Dapatkah saya menghapus data dan artefak yang terkait dengan tugas transkripsi yang disimpan oleh Amazon Transcribe?
Ya. Anda dapat menggunakan API Delete yang tersedia untuk menghapus data dan artefak lainnya yang terkait dengan tugas transkripsi. Jika Anda mengalami masalah saat melakukannya, hubungi AWS Support.
T: Siapa yang memiliki akses ke konten saya yang diproses dan disimpan oleh Amazon Transcribe?
Hanya karyawan yang berwenang yang akan memiliki akses ke konten Anda yang diproses oleh Amazon Transcribe. Kepercayaan, privasi, dan keamanan konten Anda adalah prioritas utama kami, dan kami menerapkan kontrol teknis dan fisik yang sesuai dan canggih, termasuk enkripsi tidak aktif dan dalam transit, yang dirancang untuk mencegah akses tidak sah ke, atau pengungkapan, konten Anda dan memastikan bahwa penggunaan kami sesuai dengan komitmen kami kepada Anda. Lihat https://thinkwithwp.com/compliance/data-privacy-faq/ untuk informasi selengkapnya.
T: Apakah saya masih memiliki konten saya yang diproses dan disimpan oleh Amazon Transcribe?
Anda selalu memiliki hak atas konten Anda, dan kami hanya akan menggunakan konten Anda dengan persetujuan Anda.
T. Apa yang terjadi pada data saya yang digunakan dalam model bahasa kustom pelatihan? Apakah data itu tetap menjadi milik saya?
Saat mengirimkan data teks yang digunakan untuk melatih model khusus, Anda memiliki kepemilikan atas data teks asli dan model kustom yang dihasilkan. Data teks tidak akan disimpan ataupun digunakan untuk meningkatkan mesin pengenalan ucapan umum kami. Model yang dihasilkan menggunakan CLM bersifat mandiri, dan hanya dapat diakses oleh Anda.
T. Karena layanan tidak akan mempertahankan data pelatihan saya, apakah ada kelemahan atau penurunan kualitas transkripsi atau pengalaman layanan secara keseluruhan?
Tidak akan ada penurunan kualitas transkripsi akibat layanan kami tidak menyimpan data pelatihan Anda. Setelah data pelatihan digunakan untuk benar-benar menghasilkan model bahasa kustom, model ini sendiri akan tersedia untuk penggunaan berulang sesuai kebijaksanaan Anda. Rangkaian pelatihan asli yang Anda unggah dihapus dari sistem kami. Satu-satunya kelemahan adalah jika Anda membutuhkan dukungan teknis. Karena kami tidak menyimpan data pelatihan asli Anda, kami tidak akan memiliki akses yang mudah ke aset tersebut atau artefak perantara terkait, jika Anda memerlukan tim dukungan untuk menyelidiki potensi masalah layanan. Dukungan akan tetap tersedia, tetapi tidak akan mudah karena kami mungkin perlu meminta informasi tambahan dari Anda.
T. Bagaimana cara menggunakan kembali data untuk pembaruan atau peningkatan model di masa mendatang?
Karena data pelatihan tidak disimpan, set data yang sama dan data tambahan harus diunggah lagi untuk melatih model baru. Ketika ada pembaruan pada model dasar yang disediakan Amazon Transcribe, Anda akan diberi tahu. Untuk memanfaatkan model dasar terbaru, Anda harus mengirimkan data Anda untuk melatih model baru. Anda akan memiliki model kustom asli yang sebelumnya dibuat dan juga versi baru untuk digunakan.
T. Bagaimana cara menghapus model?
Anda dapat menghapus model bahasa pelanggan yang Anda buat atas kebijaksanaan Anda sendiri.
T: Apakah konten yang diproses oleh Amazon Transcribe dipindahkan ke luar wilayah AWS tempat saya menggunakan Amazon Transcribe?
Konten apa pun yang diproses oleh Amazon Transcribe dienkripsi dan disimpan saat tidak aktif di wilayah AWS di mana Anda menggunakan Amazon Transcribe. Beberapa bagian dari konten yang diproses oleh Amazon Transcribe dapat disimpan di wilayah AWS lain semata-mata sehubungan dengan peningkatan berkelanjutan dan pengembangan pengalaman pelanggan Amazon Transcribe Anda dan teknologi machine-learning/kecerdasan buatan Amazon lainnya. Jika Anda memilih untuk tidak menggunakan konten Anda untuk mengembangkan kualitas Amazon Transcribe dan teknologi machine-learning/kecerdasan buatan Amazon lainnya dengan menghubungi AWS Support, konten Anda tidak akan disimpan di wilayah AWS lain. Anda dapat meminta penghapusan input suara yang terkait dengan akun Anda dengan menghubungi AWS Support. Kepercayaan, privasi, dan keamanan konten Anda adalah prioritas utama kami, dan kami menerapkan kontrol teknis dan fisik yang sesuai dan canggih, termasuk enkripsi saat istirahat dan dalam perjalanan, yang dirancang untuk mencegah akses tidak sah ke, atau pengungkapan, konten Anda dan memastikan bahwa penggunaan kami sesuai dengan komitmen kami kepada Anda. Lihat https://thinkwithwp.com/compliance/data-privacy-faq/ untuk informasi selengkapnya.
T: Dapatkah saya menggunakan Amazon Transcribe sehubungan dengan situs web, program, atau aplikasi lain yang ditujukan atau ditargetkan untuk anak di bawah 13 tahun dan tunduk pada Children’s Online Privacy Protection Act (COPPA)?
Ya, tunduk pada kepatuhan Anda terhadap Ketentuan Layanan Amazon Transcribe, termasuk kewajiban Anda untuk memberikan pemberitahuan yang diperlukan dan mendapatkan persetujuan orang tua yang dapat diverifikasi berdasarkan COPPA, Anda dapat menggunakan Amazon Transcribe sehubungan dengan situs web, program, atau aplikasi lain yang ditujukan atau ditargetkan, seluruhnya atau sebagian, untuk anak-anak di bawah usia 13.
T: Bagaimana saya menentukan apakah situs web, program, atau aplikasi saya tunduk pada COPPA?
Untuk informasi mengenai persyaratan COPPA dan panduan untuk menentukan apakah situs web, program, atau aplikasi lain Anda tunduk pada COPPA, silakan melihat sumber daya yang diberikan dan dipelihara oleh Komisi Perdagangan Federal Amerika Serikat. Situs ini juga berisi informasi mengenai cara menentukan apakah suatu layanan ditujukan atau ditargetkan, seluruhnya atau sebagian, untuk anak-anak di bawah usia 13.
Analitik Panggilan Amazon Transcribe
T. Apa itu Analitik Panggilan Amazon Transcribe?
Analitik Panggilan Amazon Transcribe merupakan API yang didukung AI yang menyediakan transkrip panggilan yang multifungsi dan wawasan percakapan yang bisa ditindaklanjuti. Anda bisa menambahkannya ke dalam aplikasi panggilan untuk meningkatkan pengalaman pelanggan dan produktivitas agen. API ini menggabungkan model ucapan-ke-teks dan pemrosesan bahasa alami (NLP) kustom yang dilatih secara khusus untuk memahami layanan pelanggan dan panggilan penjualan keluar. Sebagai bagian dari solusi AWS Contact Center Intelligence (CCI), API ini merupakan agnostik pusat kontak serta akan memudahkan para pelanggan dan ISV untuk menambahkan kemampuan analitik panggilan ke dalam aplikasi mereka.
T. Apa yang dapat saya lakukan dengan Analitik Panggilan Amazon Transcribe?
Analitik Panggilan Amazon Transcribe dapat melakukan analitik waktu nyata dan pascapanggilan. Dengan Analitik Panggilan, developer dapat dengan cepat menambahkan kecerdasan yang bermanfaat, seperti skor sentimen pelanggan dan agen, driver panggilan, kategori panggilan, ringkasan panggilan sebagai output API ke aplikasi panggilan masuk atau keluar. Kasus penggunaan umum mencakup bantuan agen, ringkasan, peringatan supervisor, dan analitik panggilan. Berikut adalah dua solusi sampel sumber terbuka yang didasarkan pada Analitik Panggilan Transcribe: Analitik Panggilan Waktu Nyata dengan Bantuan Agen dan Analitik Pascapanggilan.
T. Bagaimana cara menggunakan Analitik Panggilan Amazon Transcribe?
Anda bisa menggunakan Analitik Panggilan Transcribe melalui API dan Konsol Manajemen AWS. Tugas Analitik bisa dibuat dan dipantau melalui API atau Konsol. Di Konsol, Anda akan melihat daftar tugas analitik dan halaman detail tugas dengan parameter input dan pratinjau output JSON. Selain itu, Anda akan dapat membuat dan mengedit kategori melalui API atau Konsol untuk fitur kategorisasi kontak otomatis.
T. Bahasa apa sajakah yang didukung oleh Analitik Panggilan Amazon Transcribe?
Lihat dokumentasi Amazon Transcribe untuk informasi mengenai ketersediaan bahasa Analitik Panggilan Amazon Transcribe.
T. Di wilayah AWS manakah Analitik Panggilan Amazon Transcribe tersedia?
Silakan lihat dokumentasi layanan regional AWS untuk informasi tentang cakupan AWS Region untuk Analitik Panggilan Amazon Transcribe. Harap perhatikan bahwa ringkasan panggilan generatif Analitik Panggilan Amazon Transcribe saat ini hanya tersedia di AS Timur (Virginia Utara) dan AS Barat (Oregon).
T. Apakah ringkasan panggilan generatif tersedia dengan API Analitik Panggilan Transcribe pascapanggilan dan waktu nyata?
Saat ini, ringkasan panggilan generatif hanya tersedia dengan API Analitik Panggilan Transcribe untuk analitik pascapanggilan.
T. Bagaimana cara kerja penetapan harga untuk Analitik Panggilan Amazon Transcribe?
Harga API Analitik Panggilan Amazon Transcribe akan ditetapkan secara terpisah dari API Amazon Transcribe standar. Lihat halaman harga Amazon Transcribe untuk detail selengkapnya.
Amazon Transcribe Medical
T. Apa itu Amazon Transcribe Medical?
Amazon Transcribe Medical adalah layanan pengenalan ucapan otomatis (automatic speech recognition/ASR) yang memudahkan pengembang untuk menambahkan kemampuan ucapan ke teks medis ke dalam aplikasi mereka. Dengan menggunakan Amazon Transcribe Medical, Anda dapat dengan cepat dan akurat mentranskrip pendiktean medis dan ucapan percakapan ke dalam teks untuk beragam tujuan, seperti merekam catatan dokter atau memproses analitik teks akhir untuk mengekstrak wawasan yang bermakna.
T. Apa yang dapat saya lakukan dengan Amazon Transcribe Medical?
Amazon Transcribe Medical menggunakan model machine learning lanjutan untuk mentranskripsi ucapan medis ke dalam teks secara akurat. Transcribe Medical dapat menghasilkan transkrip teks yang dapat digunakan untuk mendukung beragam kasus penggunaan, menjangkau alur kerja dokumentasi klinis, dan pemantauan keamanan obat (farmakovigilans) untuk membuat subtitle pada telemedisin dan bahkan menghubungi analitik pusat dalam bidang layanan kesehatan dan ilmu hayat.
T. Untuk menggunakan Amazon Transcribe Medical, apakah saya perlu menjadi seorang ahli dalam pengenalan ucapan otomatis (ASR)?
Tidak, Anda tidak memerlukan keahlian ASR atau machine learning apa pun untuk menggunakan Amazon Transcribe Medical. Anda hanya perlu memanggil API Transcribe Medical, dan layanan akan menangani machine learning yang diperlukan dalam backend untuk mentranskrip ucapan medis ke teks.
T. Bagaimana saya memulai Amazon Transcribe Medical?
Anda dapat memulai Amazon Transcribe Medical dari AWS Management Console atau menggunakan SDK. Lihat halaman dokumentasi teknis ini untuk detailnya.
Amazon Transcribe Medical memberikan tingkat gratis sehingga Anda dapat menguji layanannya. Lihat halaman harga untuk informasi selengkapnya.
T. Bahasa apa yang didukung oleh Amazon Transcribe Medical?
Amazon Transcribe Medical saat ini mendukung transkripsi medis dalam bahasa Inggris AS.
T. Spesialisasi medis apa yang didukung oleh Amazon Transcribe Medical?
Amazon Transcribe Medical mendukung transkripsi untuk daftar perawatan utama dan spesialisasi perawatan khusus yang luas. Kunjungi dokumentasi kami untuk daftar lengkap dari dukungan spesialisasi medis.
T. Di wilayah AWS mana Amazon Transcribe Medical tersedia?
Lihat dokumentasi layanan wilayah AWS untuk informasi mengenai cakupan Wilayah AWS bagi Amazon Transcribe Medical.
T. Berapa harga Amazon Transcribe Medical?
Lihat halaman harga Amazon Transcribe Medical untuk mempelajari selengkapnya tentang detail harga.
T. Apakah HIPAA Amazon Transcribe Medical memenuhi syarat?
Ya.
T. Apakah konten yang diproses oleh Amazon Transcribe Medical digunakan untuk tujuan selain untuk menyediakan layanan?
Amazon Transcribe Medical tidak menggunakan konten yang diproses oleh layanan untuk alasan selain untuk menyediakan dan memelihara layanan. Konten yang diproses oleh layanan tidak digunakan untuk mengembangkan atau meningkatkan kualitas Amazon Transcribe Medical atau teknologi kecerdasan buatan/machine learning Amazon lainnya.
T. Apakah Amazon Transcribe Medical belajar seiring waktu?
Ya, Amazon Transcribe Medical menggunakan machine learning dan secara berkelanjutan dilatih agar menjadi semakin baik untuk kasus penggunaan pengguna. Amazon Transcribe Medical tidak menyimpan atau menggunakan data pelanggan yang digunakan dengan layanan untuk melatih model
T. Apa lagi yang harus saya ketahui sebelum menggunakan layanan Amazon Transcribe Medical?
Amazon Transcribe Medical bukanlah pengganti untuk saran, diagnosis, atau perlakuan medis profesional. Anda dan pengguna akhir Anda bertanggung jawab untuk melaksanakan kebijaksanaan, pengalaman, dan penilaian Anda dalam menentukan ketepatan, kelengkapan, ketepatan waktu, dan kesesuaian informasi apa pun yang diberikan oleh Amazon Transcribe Medical. Anda dan pengguna akhir Anda bertanggung jawab sepenuhnya atas keputusan, saran, tindakan, dan/atau bukan tindakan apa pun berdasarkan penggunaan Amazon Transcribe Medical.
Amazon Transcribe Medical mungkin tidak secara akurat mengidentifikasi informasi kesehatan yang dilindungi dalam segala situasi, dan tidak memenuhi persyaratan untuk melakukan deidentifikasi informasi kesehatan yang dilindungi tersebut sesuai dengan HIPAA. Anda bertanggung jawab untuk meninjau output yang ada, yang diberikan oleh Amazon Transcribe Medical, untuk memastikan output tersebut memenuhi kebutuhan Anda.
Model bahasa kustom
T: Fungsionalitas apa yang disediakan model bahasa kustom saat ini?
Anda dapat menggunakan model bahasa khusus (CLM) untuk melatih dan mengembangkan model bahasa yang spesifik untuk domain. CLM saat ini mendukung Bahasa Inggris Australia, Bahasa Inggris British, Bahasa Hindi, Bahasa Inggris AS, dan Bahasa Spanyol AS untuk transkripsi batch dan Bahasa Inggris AS untuk transkripsi streaming. CLM mendukung penggunaan kosakata khusus secara simultan untuk transkripsi batch.
T: Berapa banyak dan jenis data pelatihan apa yang saya butuhkan? Bagaimana cara memperoleh data? Apakah data tersebut memerlukan format tertentu?
Data teks harus relevan dengan audio yang akan ditranskrip menggunakan model kustom, yang harus berisi sebanyak mungkin kata, frasa, dan kombinasi kata khusus domain. Kami merekomendasikan menggunakan setidaknya 100.000 dan paling banyak 10 juta kata teks berjalan. Sumber daya data teks dapat diperoleh dari sumber internal atau publik mana pun (misalnya, menggunakan teks dari situs web pelanggan). Sebaiknya, setiap file teks biasa berisi 200.000 kata atau lebih, tetapi tidak melebihi 1 GB dalam ukuran file secara keseluruhan. Teks harus berupa karakter UTF-8 dan menggunakan satu kalimat per baris. Setiap kalimat harus berisi tanda baca. Pengguna bertanggung jawab untuk memeriksa ejaan, menghapus karakter pemformatan, dan memvalidasi pengodean.
T: Bagaimana cara menggunakan model bahasa khusus (CLM)?
Untuk melatih model bahasa kustom, pelanggan cukup menyuplai data teks di bucket Amazon S3. Pengguna kemudian dapat menggunakan konsol layanan Amazon Transcribe untuk memuat dan memproses data untuk melatih model bahasa kustom. Pelatihan sepenuhnya otomatis dan memerlukan intervensi minimal dari pengguna. Ketika model kustom final siap, model ini tersedia dalam akun AWS pelanggan untuk mentranskrip file audio khusus domain. Selain itu, pelanggan dapat melatih beberapa model kustom untuk digunakan dalam berbagai kasus penggunaan yang berbeda.
T: Apakah peningkatan dijamin? Apakah hal ini sepadan dengan upaya yang dikeluarkan untuk mengumpulkan data teks?
Peningkatan tidak dijamin - perubahan kinerja akan bergantung pada seberapa dekat data teks sesuai dengan audio, dan pada jumlah data yang disediakan. Lebih banyak data secara umum lebih baik, tetapi yang terpenting, data harus mencakup kata dan urutan kata yang diharapkan muncul dalam file audio yang ingin Anda transkripsikan. Peningkatan keakuratan transkripsi akan bergantung pada kualitas data pelatihan serta kasus penggunaan. Dalam beberapa skenario, tolok ukur umum menunjukkan peningkatan akurasi relatif sebanyak 10% hingga 15%.
T: Berapa lama waktu pelatihan model? Kapan saya dapat menggunakannya?
Pelatihan model biasanya memakan waktu antara 6 hingga 10 jam. Durasi pelatihan bergantung pada seberapa besar set data. Model kustom akan tersedia langsung setelah pelatihan selesai.
T: Bagaimana saya dapat menggunakan model tersebut? Bagaimana saya tahu jika model ini berfungsi dengan lebih baik daripada model umum yang disediakan oleh Amazon Transcribe?
Model akan tersedia di akun Anda pada ID model yang ditetapkan oleh Anda sebelum proses pelatihan. Untuk menggunakan model ini, tanda dengan ID model perlu ditambahkan ke permintaan transkripsi. Anda harus menguji model tersebut pada file audio dan membandingkan output dengan hasil yang diperoleh dari mesin umum.
T: Berapa banyak model bahasa khusus yang dapat saya latih? Dapatkah saya mengaktifkan beberapa model secara bersamaan untuk akun saya?
Anda dapat secara bersamaan melatih hingga 5 model berbeda pada waktu tertentu per akun AWS. Untuk setiap akun, Anda dapat menyimpan maksimal 10 model secara default. Jika diperlukan lebih banyak, peningkatan batas layanan dapat dilakukan di sini.
T: Apakah model akustik didukung?
Tidak. Model akustik kustom tidak didukung. Model bahasa kustom dibuat dari data teks yang relevan dengan kasus penggunaan atau domain Anda.
Pelajari lebih lanjut tentang harga Amazon Transcribe