etoland-logo login-icon
search_button
menu_button
menu_button
close_button
- [À̺¥Æ® ¾Ë¸²] ·Î±×ÀÎÇÏ°í ¾ËÆ÷ÀÎÆ® ¹Þ±â! -
[ÀÚÀ¯] ¹ÚÁ¾¼¼ ±³¼öÆÀ, 2024 IISWC ´Ù¼ö »ó µ¿½Ã ¼®±Ç​
rankÇØ·ù¹³Çظ® 2024-10-16 17:18 Á¶È¸ 22 Ãßõ 3 ´ñ±Û 0

(¿ÞÂʺÎÅÍ) ¹ÚÁ¾¼¼ ±³¼ö, Ç㱸½½ ¹Ú»ç°úÁ¤, Á¶ÀçÈ« ¼®»ç°úÁ¤, ±è¹Î¼ö ¹Ú»ç°úÁ¤, ÃÖÇö¹Î ¼®»ç°úÁ¤

< (¿ÞÂʺÎÅÍ) ¹ÚÁ¾¼¼ ±³¼ö, Ç㱸½½ ¹Ú»ç°úÁ¤, Á¶ÀçÈ« ¼®»ç°úÁ¤, ±è¹Î¼ö ¹Ú»ç°úÁ¤, ÃÖÇö¹Î ¼®»ç°úÁ¤ >

¿ì¸® ´ëÇÐ Àü»êÇкΠ¹ÚÁ¾¼¼ ±³¼ö ¿¬±¸ÆÀÀÌ Áö³­  9 ¿ù  15 ÀϺÎÅÍ  9 ¿ù  17 ÀϱîÁö ij³ª´Ù ¹êÄí¹ö¿¡¼­ ¿­¸°  ¡®2024 IEEE  ±¹Á¦ ¿öÅ©·Îµå Ư¼ºÈ­ ½ÉÆ÷Áö¾ö (IEEE International Symposium on Workload Characterization,  ÀÌÇÏ  IISWC 2024)¡¯ ¿¡¼­ ÃÖ¿ì¼ö ³í¹®»ó (Best Paper Award) °ú ÃÖ¿ì¼ö ¿¬±¸ ±â·Ï¹° »ó (Distinguished Artifact Award)¡¯ À» µ¿½Ã¿¡ ¼ö»óÇß´Ù°í  26 ÀÏ ¹àÇû´Ù .  

¹Ú ±³¼ö ¿¬±¸ÆÀÀº  ¡® ÃÊ°Å´ë ¾ð¾î¸ðµ¨ Ãß·Ð ¼­ºñ½º Á¦°øÀ» À§ÇÑ  HW/SW  °øµ¿ ½Ã¹Ä·¹ÀÌ¼Ç ÀÎÇÁ¶ó ( LLMServingSim: A HW/SW Co-Simulation Infrastructure for LLM Inference Serving at Scale )¡¯  ³í¹®À¸·Î µÎ »óÀ» µ¿½Ã¿¡ ¼ö»óÇß´Ù .

±×¸² 1. °³¹ßÇÑ ½Ã¹Ä·¹ÀÌ¼Ç ÀÎÇÁ¶óÀÇ È帧

< ±×¸² 1. °³¹ßÇÑ ½Ã¹Ä·¹ÀÌ¼Ç ÀÎÇÁ¶óÀÇ È帧 >

IISWC ´Â  ÄÄÇ»ÅÍ ½Ã½ºÅÛ ¿öÅ©·Îµå Ư¼ºÈ­ ºÐ¾ß ¿¡¼­ ±ÇÀ§¸¦ ÀÚ¶ûÇÏ´Â   ±¹Á¦ ÇÐȸÀÌ¸ç °³Ãֽø¶´Ù  ÃÖ¿ì¼ö ³í¹®»ó°ú ÃÖ¿ì¼ö ¿¬±¸ ±â·Ï¹° »óÀ» Çϳª¾¿ ¼ö¿©Çϴµ¥ ¿ÃÇØ¿¡´Â ¹Ú ±³¼öÆÀÀÇ ³í¹®ÀÌ µÎ »óÀ» ¸ðµÎ ´Üµ¶À¸·Î ¼ö»óÇß´Ù .  

À̹ø ¼ö»ó ¿¬±¸´Â ´ë±Ô¸ð °Å´ë¾ð¾î¸ðµ¨ (LLM)  Ãß·Ð ¼­ºñ½º¸¦ À§ÇÑ Çϵå¿þ¾î¿Í ¼ÒÇÁÆ®¿þ¾î ÅëÇÕ ½Ã¹Ä·¹ÀÌ¼Ç ÀÎÇÁ¶ó¸¦ ÃÖÃÊ °³¹ßÇÑ Á¡ ÇâÈÄ  LLM  Ãß·Ð ¿¬±¸ÀÇ Áö¼ÓÀûÀÎ ¹ßÀüÀ» À§ÇØ ¿ÀǼҽº·Î °ø°³ÇÑ ÄÚµåÀÇ ¿Ï¼ºµµ¿Í »ç¿ëÀÚ ÆíÀǼº Ãø¸é¿¡¼­ ³ôÀº Æò°¡¸¦ ¹Þ¾Ò´Ù .  

À̹ø ¿¬±¸¿¡¼­ ¿¬±¸ÆÀÀº ê GPT ¿Í °°Àº  LLM  Ãß·Ð ¼­ºñ½º¸¦ ½ÇÇàÇÏ´Â ´ë±Ô¸ð ½Ã½ºÅÛÀ» ¿©·¯ °¡Áö Çϵå¿þ¾î¿Í ¼ÒÇÁÆ®¿þ¾î¸¦ Ãß°¡ÇØ ½Ã¹Ä·¹À̼ÇÇÒ ¼ö ÀÖ´Â ½Ã¹Ä·¹ÀÌ¼Ç ÀÎÇÁ¶ó¸¦ Á¦¾ÈÇß´Ù .

±×¸² 2. °³¹ßÇÑ ½Ã¹Ä·¹ÀÌ¼Ç ÀÎÇÁ¶óÀÇ ½ÇÇà ½Ã°£ ´ÜÃà ±â¼ú

< ±×¸² 2. °³¹ßÇÑ ½Ã¹Ä·¹ÀÌ¼Ç ÀÎÇÁ¶óÀÇ ½ÇÇà ½Ã°£ ´ÜÃà ±â¼ú >

À̸¦ ÅëÇØ  GPU( ±×·¡ÇÈó¸®ÀåÄ¡ ), NPU( ½Å°æ¸Áó¸®ÀåÄ¡ ) ¿Í  PIM( Áö´ÉÇü¸Þ¸ð¸®¹ÝµµÃ¼ ) °ú °°Àº ´Ù¾çÇÑ Çϵå¿þ¾î»Ó¸¸ ¾Æ´Ï¶ó ¹Ýº¹ ¼öÁØ ½ºÄÉÁ층 , KV  ij½Ã ÆäÀÌ¡°ú °°Àº ÃÊ°Å´ë ¾ð¾î¸ðµ¨ Ãß·ÐÀ» À§ÇÑ ¼ÒÇÁÆ®¿þ¾îÀû ¿ä¼Ò¸¦ ¸ðµÎ ÇÔ²² ½Ã¹Ä·¹À̼ÇÇÒ ¼ö ÀÖ¾ú´Ù .

±×¸² 3. °³¹ßÇÑ ½Ã¹Ä·¹ÀÌ¼Ç ÀÎÇÁ¶óÀÇ ÀÌÁ¾ °¡¼Ó±â Áö¿ø

< ±×¸² 3. °³¹ßÇÑ ½Ã¹Ä·¹ÀÌ¼Ç ÀÎÇÁ¶óÀÇ ÀÌÁ¾ °¡¼Ó±â Áö¿ø >

À̹ø ¿¬±¸´Â  KAIST  Àü»êÇкΠ¹ÚÁ¾¼¼ ±³¼öÆÀÀÇ Á¶ÀçÈ« ±è¹Î¼ö ÃÖÇö¹Î Ç㱸½½ ÇлýµéÀÌ ÁÖµµÇß´Ù .  

»óÀ» ¹ÞÀº  KAIST  Àü»êÇкΠ¹ÚÁ¾¼¼ ±³¼ö´Â   ¡° À̹ø ¿¬±¸¸¦ ÅëÇØ , LLM  Ŭ¶ó¿ìµå »ó¿¡¼­ ´Ù¾çÇÑ  AI  ¹ÝµµÃ¼¿Í ½Ã½ºÅÛ ¼ÒÇÁÆ®¿þ¾îÀÇ ¼º´ÉÀ» Á¾ÇÕÀûÀ¸·Î Æò°¡ÇØ º¼ ¼ö ÀÖ´Â ¿ÀǼҽº µµ±¸ (Tool) À» °ø°³ÇÒ ¼ö ÀÖ°Ô µÇ¾î ±â»Ú°í ¾ÕÀ¸·Îµµ »ý¼ºÇü  AI ¸¦ À§ÇÑ Å¬¶ó¿ìµå ½Ã½ºÅÛ ¿¬±¸¸¦ Áö¼ÓÇØ ³ª°¥ °ÍÀÌ´Ù ¡± ¶ó°í ¼Ò°¨À» ÀüÇß´Ù .

»çÁø 2. ¹ÚÁ¾¼¼ ±³¼ö ¿¬±¸ÆÀÀÇ ±¹Á¦Çмú´ëȸ ¹ßÇ¥ »çÁø

< »çÁø 2. ¹ÚÁ¾¼¼ ±³¼ö ¿¬±¸ÆÀÀÇ ±¹Á¦Çмú´ëȸ ¹ßÇ¥ »çÁø >

À̹ø ¿¬±¸ °á°ú´Â ê GPT ¿Í °°ÀÌ  LLM À» È°¿ëÇÏ´Â ´Ü¼øÇÑ Ãªº¿  AI ¸¦ ³Ñ¾î »ý¼ºÇü  AI(Generative AI) ·Î ´ëÇ¥µÇ´Â ¹Ì·¡  AI  »ê¾÷¿¡¼­ ÀÌÁ¾  AI  ¹ÝµµÃ¼ ±â¹Ý Ŭ¶ó¿ìµå ½Ã½ºÅÛÀ» ±¸ÃàÇÏ´Â µî ´Ù¾çÇÑ ºÐ¾ß¿¡ È°¿ëµÉ ¼ö ÀÖÀ» °ÍÀ¸·Î ±â´ëµÈ´Ù .  

ÇÑÆí À̹ø ¿¬±¸´Â Çѱ¹¿¬±¸Àç´Ü ¿ì¼ö½ÅÁø¿¬±¸ÀÚÁö¿ø»ç¾÷ Á¤º¸Åë½Å±âȹÆò°¡¿ø (IITP),  ÀΰøÁö´É¹ÝµµÃ¼´ëÇпøÁö¿ø»ç¾÷ ¹× ÇÏÀÌÆÛ¿¢¼¿ÀÇ Áö¿øÀ» ¹Þ¾Æ ¼öÇàµÆ´Ù .

»çÁø 3. »óÀå »çÁø

< »çÁø 3. »óÀå »çÁø >


https://news.kaist.ac.kr/news/html/news/?mode=V&mng_no=40250

ÀÚ±â¼Ò°³°¡ ¾ø½À´Ï´Ù.

🔥 ¿À´ÃÀÇ HIT 10
    🔥 ¿À´ÃÀÇ HIT 30

    ⏰ ÃÖ½Å±Û (NEW)

    Àüü À¯¸Ó ¿¬¿¹ ÀÚÀ¯ ½Ã»ç Ä¿¹Â °í¹Î

    ❤️‍🔥 HIT

    °øÀ¯Çϱâ

    ȨÀ¸·Î | ·Î±×ÀÎ | PC¹öÀü | ´ÙÅ©¸ðµå | ¸ÇÀ§·Î
    Ã⼮üũ | Æ÷ÀÎÆ®Á¤Ã¥ | Æ÷ÀÎÆ®¼øÀ§ |

    ÀÌÅä·£µå ·Î°í

    °èÁ¤ ã±â ȸ¿ø°¡ÀÔ
    ¼Ò¼È·Î±×ÀÎ