Apakah Google Oke Dengan Tweaks Kecil Untuk Terjemahan Mesin?

Apakah Google Oke Dengan Tweaks Kecil Untuk Terjemahan Mesin?

Jam kerja SEO Google bulan Oktober menjawab apakah boleh menggunakan konten yang diterjemahkan secara otomatis yang telah ditinjau oleh manusia dan hanya mengalami sedikit perubahan pengeditan.

Episode Google SEO-Office Hours

Episode hangout jam kantor ini mengikuti format baru di mana pertanyaan diajukan, dan jawaban diberikan.

Karyawan Google yang menjawab pertanyaan tersebut adalah Lizzi Sassman dan John Mueller.

Lizzi Sasman (@okaylizzi) adalah penulis teknologi yang “memperhatikan” dokumentasi Pusat Situs Google.

Berbeda dengan format live sebelumnya, di mana penonton mengajukan pertanyaan secara real time, tidak ada kesempatan untuk mengajukan pertanyaan lanjutan.

Ini menghasilkan jawaban yang sangat mirip dengan dokumentasi Google, dan tidak ada yang dapat mengajukan pertanyaan yang tersisa.

Orang yang mengajukan pertanyaan khawatir tentang konten mereka yang diterjemahkan oleh mesin dari bahasa lain.

Mereka mempekerjakan editor manusia untuk meninjau konten yang dianggap dapat diterima kecuali untuk perubahan kecil.

Secara alami, orang yang mengajukan pertanyaan khawatir tentang apakah “perubahan kecil” cukup untuk membuat konten dapat diterima oleh Google.

Lizzi Sassman menjawab pertanyaan dengan cara yang sangat mematuhi apa yang dinyatakan oleh dokumentasi Google.

Bisa dibilang, jawabannya bisa diklarifikasi dengan pertanyaan lanjutan untuk menentukan apakah “perubahan kecil” cukup baik. Lagi pula, pertanyaannya menanyakan secara eksplisit apakah tweak kecil cukup baik untuk Google.

Mungkin jawaban tersirat adalah menggunakan penilaian Anda tentang kualitas konten yang diterjemahkan.

Hakim untuk diri sendiri.

Apakah Konten Terjemahan Mesin yang Cukup Diedit Dapat Diterima?

Mereka bertanya:

“Sebuah situs menggunakan terjemahan mesin untuk menawarkan posting dalam bahasa lain.

Konten ditinjau oleh penerjemah manusia dan mereka sering puas dengan kualitasnya setelah perubahan kecil.

Apakah ini baik-baik saja untuk Google?”

Lizzi Sassman dari Google menjawab:

“Itu bagus untuk mendengar bahwa penerjemah manusia senang dan ini benar-benar baik untuk Google selama ada manusia yang terlibat dalam proses peninjauan. Itu kuncinya.

Hal yang ingin diwaspadai adalah memastikan kualitasnya tetap baik dan berfungsi dengan baik bagi manusia yang membaca konten tersebut.”

Jawabannya tidak secara spesifik mengatakan jika suntingan kecil baik-baik saja, hanya saja jika “penerjemah manusia” baik dengan itu, maka itu akan baik untuk Google.

Mungkinkah Google tidak memeriksa apakah konten diterjemahkan oleh mesin tetapi bergantung pada sinyal kualitas konten standar?

Kami tidak tahu.

Format Jam Kerja yang baru tidak memberikan kesempatan kepada orang yang mengajukan pertanyaan untuk mengajukan pertanyaan lanjutan.

Kebijakan Spam Google

Dokumentasi pengembang Google tentang konten spam menyebutkan alat terjemahan teks otomatis dan secara eksplisit mengatakan bahwa itu adalah spam kecuali jika ada elemen manusia yang terlibat.

ini adalah apa Dokumentasi Google menyatakan:

“Contoh konten yang dibuat secara otomatis berisi spam meliputi:

Teks diterjemahkan oleh alat otomatis tanpa tinjauan atau kurasi manusia sebelum diterbitkan”

Jadi jelas dari pedoman yang diterbitkan Google bahwa selama manusia mengedit konten yang diterjemahkan mesin, Google akan baik-baik saja dengan itu.

Selain itu, dalam video Google Office-Hours dari April 2022, John Mueller menyebutkan bagaimana konten yang dibuat oleh AI dianggap sebagai spam dan kemudian menyebutkan konten yang diterjemahkan secara otomatis.

Mueller berbicara tentang alat pembuat konten AI dan membandingkannya dengan alat terjemahan otomatis.

Pada 24:55 menit dari video Jam Kerja April 2022, Mueller mengatakan:

“Saya pikir, entahlah, seiring berjalannya waktu, mungkin ini adalah sesuatu yang akan berkembang, dalam arti itu akan lebih menjadi alat bagi orang-orang.

Seperti Anda akan menggunakan terjemahan mesin sebagai dasar untuk membuat versi terjemahan situs web.

Tapi Anda masih … pada dasarnya mengerjakannya secara manual. ”

Mengapa Seorang Manusia Harus Memeriksa Konten yang Diterjemahkan Otomatis?

Seperti disebutkan di atas, kekhawatiran Google adalah bahwa konten yang dirujuk dari halaman hasil mesin pencari (SERP) berkualitas tinggi dan pengguna akan senang dengannya.

Sesuatu yang tidak dibahas adalah bahwa konten yang diterjemahkan berisi tanda tangan yang dapat diidentifikasi oleh algoritme pendeteksian terjemahan.

Mendeteksi konten yang diterjemahkan mesin adalah sesuatu yang telah diteliti selama bertahun-tahun.

Sebuah makalah penelitian dari tahun 2021 (Deteksi Teks yang Diterjemahkan Mesin Melalui Kesamaan Teks dengan Terjemahan Pulang PergiUnduh PDF) menyatakan bahwa konten yang diterjemahkan dari satu bahasa ke bahasa lain dapat menjadi rumit untuk dideteksi oleh manusia.

Misalnya, dengan menggunakan 100 teks terjemahan, penilai manusia hanya dapat mengidentifikasi lebih dari setengah teks yang diterjemahkan.

Para peneliti mencatat:

“Akurasi rata-rata adalah 53,3% (55,0% untuk penutur asli dan 52,0% untuk penutur bukan penutur asli), yang mendekati acak.”

Pendekatan yang disebut Text Similarity With Round-Trip Translation (TSRT), mengungguli penilai manusia dan mendapat skor lebih tinggi daripada detektor terjemahan mutakhir ketika makalah diterbitkan pada tahun 2021.

Hebatnya, teknik ini bisa mendeteksi bahasa asli teks terjemahan.

Hal ini juga dapat menentukan algoritma terjemahan yang melakukan terjemahan.

Mereka melaporkan:

“Hasil evaluasi menunjukkan bahwa TSRT mengungguli metode lain, dengan akurasi hingga 90,2%.

Selain itu, TSRT juga dapat mengidentifikasi penerjemah asli dan bahasa terjemahan dengan akurasi masing-masing 93,3% dan 85,6%.”

Tidak jelas apakah Google dapat mendeteksi konten yang diterjemahkan dan apakah Google bahkan mencoba mendeteksi konten yang diterjemahkan atau tidak.

Tapi kita tahu bahwa teknologi untuk mendeteksi itu ada. Teknologi ini dapat mendeteksi konten yang diterjemahkan lebih baik daripada manusia dan menentukan algoritme terjemahan mana yang melakukan terjemahan.

Jika fakta bahwa itu melanggar Pedoman Webmaster dan mungkin memiliki pengalaman pengguna yang negatif tidak cukup untuk memotivasi pengeditan konten yang diterjemahkan mesin, maka mungkin kemungkinan bahwa Google sedang menganalisis kualitas konten untuk terjemahan mesin mungkin menjadi alasan untuk memberikan konten semacam itu tinjauan yang komprehensif.


Kutipan

Dengarkan hangout Google Office Hours pada menit ke 17:50.

Gambar unggulan oleh Shutterstock/g_tech

Share

Leave a Reply

Your email address will not be published. Required fields are marked *