Algoritma Frank–Wolfe
Artikel ini tidak memiliki kategori atau memiliki terlalu sedikit kategori. Bantulah dengan menambahi kategori yang sesuai. Lihat artikel yang sejenis untuk menentukan apa kategori yang sesuai. Tolong bantu Wikipedia untuk menambahkan kategori. |
Algoritma Frank–Wolfe (bahasa Inggris: Frank-Wolfe algorithm) adalah algoritma optimasi iteratif orde pertama yang digunakan untuk optimasi cembung terkendala. Juga dikenal sebagai metode gradien bersyarat,[1] algoritma gradien tereduksi, dan algoritma kombinasi cembung. Metode ini awalnya diusulkan oleh Marguerite Frank dan Philip Wolfe pada tahun 1956.[2] Dalam setiap iterasi, algoritma Frank–Wolfe mempertimbangkan hampiran linear dari fungsi objektif, dan bergerak menuju peminimalisasi fungsi linier ini (diambil dari domain yang sama).
Rumusan masalah
[sunting | sunting sumber]Misalkan adalah himpunan cembung kompak dalam ruang vektor dan adalah fungsi terdiferensialkan bernilai riil yang konveks dan terdiferensialkan. Algoritma Frank–Wolfe memecahkan masalah optimasi
- Minimasi
- dengan .
Algoritma
[sunting | sunting sumber]- Inisialisasi: Misal , dan adalah poin sembarang pada .
- Langkah 1. Submasalah pencarian arah: Cari yang menyelesaikan
- Minimasi
- dengan
- (Interpretasi: Minimasi hampiran linear dari masalah yang diberikan dari hampiran Taylor orde pertama dari di sekitar yang dibatasi untuk tetap berada di dalam )
- Langkah 2. Penentuan jumlah langkah: Tetapkan , atau dengan cara lain, mencari yang meminimalkan dengan .
- Langkah 3. Perbarui: Misalkan , dan kemudian kembali ke langkah 1.
Sifat-sifat
[sunting | sunting sumber]Meskipun metode yang mirip, seperti penurunan gradien untuk optimasi terkendala membutuhkan langkah proyeksi kembali ke himpunan yang layak di setiap iterasi, algoritma Frank–Wolfe hanya membutuhkan solusi masalah linear pada himpunan yang sama di setiap iterasi, dan secara otomatis tetap berada di himpunan yang layak.
Konvergensi algoritma Frank – Wolfe secara umum bersifat sublinear: galat pada fungsi objektif hingga mencapai optimal adalah setelah k iterasi, selama gradiennya kontinu Lipschitz terhadap suatu norma. Tingkat konvergensi yang sama juga dapat ditunjukkan jika submasalah hanya diselesaikan secara hampiran.[3]
Iterasi algoritma selalu dapat direpresentasikan sebagai kombinasi cembung jarang dari titik-titik ekstrim dari himpunan layak, yang telah membantu popularitas algoritma ini untuk optimasi greedy jarang (sparse greedy optimization) dalam pemelajaran mesin dan pemrosesan sinyal,[4] serta misalnya optimasi arus biaya minimum dalam jaringan transportasi.[5]
Jika himpunan layak diberikan oleh himpunan berkendala linier, maka submasalah yang harus diselesaikan pada setiap iterasi menjadi program linier.
Sedangkan tingkat konvergensi pada kasus terburuk dengan secara umum tidak dapat diperbaiki, konvergensi yang lebih cepat dapat diperoleh untuk kelas masalah khusus, seperti beberapa masalah yang sangat cembung.[6]
Batas bawah pada nilai solusi, dan analisis primal-dual
[sunting | sunting sumber]Karena adalah fungsi konveks, untuk dua titik sembarang, kita mempunyai:
Hal ini juga berlaku untuk solusi optimal (yang tidak diketahui). . Artinya, . Batas bawah terbaik sehubungan titik tertentu diberikan oleh
Masalah optimasi yang terakhir diselesaikan pada setiap iterasi algoritma Frank–Wolfe. Oleh karena itu, solusi dari submasalah pencarian arah dari Iterasi ke- dapat digunakan untuk menentukan peningkatan batas bawah pada setiap iterasi dengan menetapkan dan
Batas bawah pada nilai optimal yang tidak diketahui ini penting dalam praktiknya karena dapat digunakan sebagai kriteria penghentian, dan memberikan jaminan kualitas hampiran yang efisien pada setiap iterasi, karena selalu .
Telah ditunjukkan bahwa kesenjangan dualitas ini yang sesuai, artinya perbedaan antara dan batas bawah , menurun dengan tingkat konvergensi yang sama, yaitu
Catatan
[sunting | sunting sumber]- ^ Levitin, E. S.; Polyak, B. T. (1966). "Constrained minimization methods". USSR Computational Mathematics and Mathematical Physics. 6 (5): 1. doi:10.1016/0041-5553(66)90114-5.
- ^ Frank, M.; Wolfe, P. (1956). "An algorithm for quadratic programming". Naval Research Logistics Quarterly. 3 (1–2): 95–110. doi:10.1002/nav.3800030109.
- ^ Dunn, J. C.; Harshbarger, S. (1978). "Conditional gradient algorithms with open loop step size rules". Journal of Mathematical Analysis and Applications. 62 (2): 432. doi:10.1016/0022-247X(78)90137-3.
- ^ Clarkson, K. L. (2010). "Coresets, sparse greedy approximation, and the Frank-Wolfe algorithm". ACM Transactions on Algorithms. 6 (4): 1–30. doi:10.1145/1824777.1824783.
- ^ Fukushima, M. (1984). "A modified Frank-Wolfe algorithm for solving the traffic assignment problem". Transportation Research Part B: Methodological. 18 (2): 169–177. doi:10.1016/0191-2615(84)90029-8.
- ^ Bertsekas, Dimitri (1999). Nonlinear Programming. Athena Scientific. hlm. 215. ISBN 978-1-886529-00-7.
Bibliografi
[sunting | sunting sumber]- Jaggi, Martin (2013). "Revisiting Frank–Wolfe: Projection-Free Sparse Convex Optimization". Journal of Machine Learning Research: Workshop and Conference Proceedings. 28 (1): 427–435. (Overview paper)
- The Frank–Wolfe algorithm description
- Nocedal, Jorge; Wright, Stephen J. (2006). Numerical Optimization (edisi ke-2nd). Berlin, New York: Springer-Verlag. ISBN 978-0-387-30303-1..
Pranala eksternal
[sunting | sunting sumber]- https://conditional-gradients.org/: sebuah survei terkait algoritma Frank–Wolfe.
- Marguerite Frank memberikan penjelasan pribadi tentang sejarah algoritma