پیشروی ترنسفورمرها در زمینهی پردازش تصویر!
در این مقاله، نویسندگان ناشناسش (تحت داوری ICLRعه) اومدند از ترنسفورمر برای تسک دستهبندی تصاویر استفاده کردند. به این شکل که هر تصویر را اومدند به قسمتهای ۱۶*۱۶ تقسیم کردند و هر کدام را پشت سر هم مثل توکن دادند به انکودر ترنسفورمر و بردار خروجی را به یک شبکهی عصبی چندلایهی ساده دادند و تونستند با منابع کمتر state of the art را رد کنند.
آیا CNNها هم به سرنوشت نکبتبار RNNها دچار میشوند؟ :)
لینک مقاله و کدش ضمیمه شده است.
https://openreview.net/forum?id=YicbFdNTTy
https://paperswithcode.com/paper/an-image-is-worth-16x16-words-transformers
#read
#paper
@nlp_stuff
در این مقاله، نویسندگان ناشناسش (تحت داوری ICLRعه) اومدند از ترنسفورمر برای تسک دستهبندی تصاویر استفاده کردند. به این شکل که هر تصویر را اومدند به قسمتهای ۱۶*۱۶ تقسیم کردند و هر کدام را پشت سر هم مثل توکن دادند به انکودر ترنسفورمر و بردار خروجی را به یک شبکهی عصبی چندلایهی ساده دادند و تونستند با منابع کمتر state of the art را رد کنند.
آیا CNNها هم به سرنوشت نکبتبار RNNها دچار میشوند؟ :)
لینک مقاله و کدش ضمیمه شده است.
https://openreview.net/forum?id=YicbFdNTTy
https://paperswithcode.com/paper/an-image-is-worth-16x16-words-transformers
#read
#paper
@nlp_stuff
tg-me.com/nlp_stuff/81
Create:
Last Update:
Last Update:
پیشروی ترنسفورمرها در زمینهی پردازش تصویر!
در این مقاله، نویسندگان ناشناسش (تحت داوری ICLRعه) اومدند از ترنسفورمر برای تسک دستهبندی تصاویر استفاده کردند. به این شکل که هر تصویر را اومدند به قسمتهای ۱۶*۱۶ تقسیم کردند و هر کدام را پشت سر هم مثل توکن دادند به انکودر ترنسفورمر و بردار خروجی را به یک شبکهی عصبی چندلایهی ساده دادند و تونستند با منابع کمتر state of the art را رد کنند.
آیا CNNها هم به سرنوشت نکبتبار RNNها دچار میشوند؟ :)
لینک مقاله و کدش ضمیمه شده است.
https://openreview.net/forum?id=YicbFdNTTy
https://paperswithcode.com/paper/an-image-is-worth-16x16-words-transformers
#read
#paper
@nlp_stuff
در این مقاله، نویسندگان ناشناسش (تحت داوری ICLRعه) اومدند از ترنسفورمر برای تسک دستهبندی تصاویر استفاده کردند. به این شکل که هر تصویر را اومدند به قسمتهای ۱۶*۱۶ تقسیم کردند و هر کدام را پشت سر هم مثل توکن دادند به انکودر ترنسفورمر و بردار خروجی را به یک شبکهی عصبی چندلایهی ساده دادند و تونستند با منابع کمتر state of the art را رد کنند.
آیا CNNها هم به سرنوشت نکبتبار RNNها دچار میشوند؟ :)
لینک مقاله و کدش ضمیمه شده است.
https://openreview.net/forum?id=YicbFdNTTy
https://paperswithcode.com/paper/an-image-is-worth-16x16-words-transformers
#read
#paper
@nlp_stuff
BY NLP stuff


Share with your friend now:
tg-me.com/nlp_stuff/81