Mengenai deteksi deret waktu, yang sering kami katakan, sebenarnya digunakan di banyak tempat, seperti pemantauan server, analisis lalu lintas jaringan, dan data transaksi di bidang keuangan. Jika Anda dapat menemukan ide -ide yang tidak normal ini … Anda dapat menemukan masalah dalam waktu, jika tidak akan merepotkan ketika sesuatu yang besar terjadi.
Pertama -tama, Anda harus memahami apa itu. Sebenarnya, sederhananya … Sederhananya, itu adalah memilih titik data atau periode waktu yang tidak seperti mode normal, yang mungkin memiliki masalah atau sangat aneh, dari data yang berubah dari waktu ke waktu. Misalnya, jika harga saham naik perlahan, tiba -tiba turun banyak, yang mungkin hanya masalah ini; Atau jika suhu mesin pabrik cukup stabil dan tiba -tiba naik, Anda harus memperhatikan apakah ada sesuatu yang salah.
Metode penilaian umum … Saya memikirkannya, ada beberapa jenis utama:
1. Metode Statistik: Ini cukup kuno, seperti nilai rata-rata, varian, dll., Yang melebihi rentang tertentu, seperti menambahkan dan mengurangi nilai rata-rata dengan tiga kali standar deviasi, bahkan jika itu merupakan pengecualian. Tapi … tapi yang berurusan dengan sederhana ini tidak apa -apa, tetapi model yang lebih kompleks tidak terlalu efektif.
2. Metode Pembelajaran Mesin: Ini banyak digunakan sekarang! Diawasi, seperti melatih model untuk mempelajari penampilan normal dan abnormal; Dan tanpa pengawasan, seperti pengelompokan, biarkan model menemukan hal -hal unik itu sendiri.
3. Metode Pembelajaran Mendalam: Ini lebih maju … ini sedikit lebih maju. Apa itu LSTM, yang dapat memproses data dengan ketergantungan waktu yang kompleks, dan efeknya seringkali sedikit lebih baik daripada pembelajaran mesin tradisional.
Apa yang harus saya perhatikan ketika saya benar -benar melakukannya …
Pemrosesan data adalah penting! Ketika Anda mendapatkan data, Anda akan terlebih dahulu memeriksa … lihat apakah ada nilai yang hilang, apakah Anda perlu menghaluskannya, atau melakukan normalisasi, standardisasi, dll. Ini akan memengaruhi hasil pengujian selanjutnya. Data tidak bagus, tidak peduli seberapa kuat modelnya, itu tidak akan berguna … itu benar!
Memilih metode yang tepat sangat penting! Anda tidak dapat menggunakan metode yang sama terlepas dari data apa pun … itu tergantung pada apakah data memiliki label? Apakah aturan waktu yang kuat? Apakah ada sumber daya komputasi yang cukup? Jika volume data besar dan kompleks, pembelajaran mendalam mungkin diperlukan; Jika data sederhana skala kecil, metode statistik mungkin cukup dan cepat.
Ada beberapa poin khusus dalam menetapkan ambang batas … ambang ini terlalu tinggi, dan jika semua kelainan tidak ditemukan, itu akan merepotkan jika Anda melewatkannya; Terlalu rendah … jika terlalu rendah, Anda akan menganggap banyak data normal sebagai pengecualian, membuat alarm palsu, membuat orang sia -sia!
Beberapa orang mungkin bertanya: apa kesulitannya dibandingkan dengan orang biasa? Yah … yang biasa mungkin tidak masalah pesanan waktu, itu tergantung pada bagaimana titik data tunggal … Tidak! Itu harus mempertimbangkan hubungan antara titik data dan titik waktu sebelumnya, seperti tren, periodisitas, dan mungkin musiman. Ini jauh lebih sulit … itu benar -benar jauh lebih rumit.
Haruskah saya menggunakan data berlabel untuk pelatihan? Jika ada … tentu saja baik jika ada, efek pembelajaran yang diawasi mungkin lebih akurat; Jika tidak ada, itu juga bisa … menggunakan tanpa pengawasan atau semi-diawasi untuk membiarkan model mempelajari mode normal dengan sendirinya, dan kemudian … dan tandai yang berbeda. Namun, lebih mudah untuk berlatih dengan label, tetapi data label yang baik jarang terjadi. Pikirkan tentang hal ini, tidak ada banyak data abnormal, dan masih sulit untuk menandainya.
Saya juga memiliki pendapat pribadi, ini adalah pekerjaan teknis. Pada awalnya, Anda tidak perlu mengejar model yang paling kompleks. Mari kita coba dengan metode sederhana. Memahami data, lihat apa data itu, kemudian pilih metode yang sesuai, dan kemudian berulang kali menyesuaikan parameter dan mengevaluasi efeknya, dan Anda selalu dapat membuat kemajuan secara perlahan. Dan … dan sekarang ada banyak kode dan alat open source, seperti pyod dan -lego, yang tampaknya memiliki fungsi terkait. Ini pasti akan membantu membaca lebih banyak yang resmi!
Tinggalkan Balasan