분류 전체보기(62)
-
파슷하
겨울내 언 밭을 가꾸러 왔습니다. 겨울내 토마토와 열심히 대방어랑 파스타를 푸파하러 다녔는데요.(음식이랑 싸웠다고 했지 이겼다곤 하지 않았습니다..ㅎㅎ) 분명 많이 먹었는데, 막상 사진을 찾아보니 없더라고요?!?그래서 그냥 있는거 몇개만 후기를 적어볼까해요. 제주도에서 정통 까르보나라에 눈을 뜬 후 맛있는 까르보나라를 찾으러 다녔어요.일부로 찾아다니진 않고 그냥 눈에 띄면 먹었어요. 판교 이탈리https://naver.me/FW6GmiNj 네이버 지도이탈리 판교점map.naver.com 갑분 서울 - 나인원 한남파스타엑스https://naver.me/FDnoZ0ad 네이버 지도파스타엑스map.naver.com여긴 정말 추천이에요!한남동에 있는데 주차장도 너무 넓고 편리하고생각보다 가격은 합리적이었습니다...
2025.03.23 -
[논문리뷰] Simple and Effective Masked Diffusion Language Models
Sahoo, S., Arriola, M., Schiff, Y., Gokaslan, A., Marroquin, E., Chiu, J., ... & Kuleshov, V. (2024). Simple and effective masked diffusion language models. Advances in Neural Information Processing Systems, 37, 130136-130184.https://s-sahoo.com/mdlm/ MDLM Blog postSimple and Effective Masked Diffusion Language Modelss-sahoo.com 한동안 글을 작성하지 않다가 폭풍처럼 Diffusion Language Model (DLM)을 살펴 보고 있는데요.수많은..
2025.03.21 -
[논문리뷰] Likelihood-Based Diffusion Language Models
Ishaan Gulrajani and Tatsunori B. Hashimoto. 2023. Likelihood-based diffusion language models. In Proceedings of the 37th International Conference on Neural Information Processing Systems (NIPS '23). Curran Associates Inc., Red Hook, NY, USA, Article 730, 16693–16715.https://proceedings.neurips.cc/paper_files/paper/2023/file/35b5c175e139bff5f22a5361270fce87-Paper-Conference.pdf 전통적인 LLM, 즉 auto-..
2025.03.21 -
[논문리뷰] Large Language Diffusion Models
Nie, S., Zhu, F., You, Z., Zhang, X., Ou, J., Hu, J., Zhou, J., Lin, Y., Wen, J., & Li, C. (2025). Large Language Diffusion Models.https://arxiv.org/abs/2502.09992 Large Language Diffusion ModelsAutoregressive models (ARMs) are widely regarded as the cornerstone of large language models (LLMs). We challenge this notion by introducing LLaDA, a diffusion model trained from scratch under the pre-tr..
2025.03.19 -
[컬럼리뷰] A Dive into Vision-Language Models
벌써 1월, 아니 2월, 아니 3월입니다.2025년을 너무 정신 없이 살다보니 블로그 글 업데이트는 계속 늦어졌네요.오늘은 토마토에게 한소리 듣고 작성해보는 Vision Language Model (VLM) 리뷰입니다.VLM 관련 연구를 하면서 정작 VLM에 대해서는 돌아보지 않는다구 박.. 은 아니고 뭐 그렇습니다. 이번에 리뷰할 글은 논문은 아니고 허깅페이스에 올라온 컬럼(?)입니다.https://huggingface.co/blog/vision_language_pretraining#supporting-vision-language-models-in-%F0%9F%A4%97-transformers A Dive into Vision-Language Models huggingface.coVLM 모델을 가볍게 ..
2025.03.12 -
[논문리뷰] DeepSeek-V3 Technical Report
최근 LLM 분야에서 가장 핫한 주제인 DeepSeek를 V3부터 R1까지, DeepSeek에서 발표한 논문을 기반으로 파헤쳐 보려합니다.https://github.com/deepseek-ai/DeepSeek-V3?tab=readme-ov-file GitHub - deepseek-ai/DeepSeek-V3Contribute to deepseek-ai/DeepSeek-V3 development by creating an account on GitHub.github.com그럼 V3부터 바로 리뷰해보도록 할게요!오늘도 파란 글씨는 제 사견입니다.AbstractDeepSeek-V3는 총 671B, 각 토큰당 37B 개의 파라미터가 활성화되는 강력한 Mixture-of-Experts (MoE) 언어모델인 Deep..
2025.02.04