2022 Annual Retrospect
- 2022 Jan - July : Internship @ Aigendrug. Co. Ltd
- 2022 Spring Semester : ํ๋ถ ๋ง์ง๋ง ํ๊ธฐ
- 2022 Aug - 2022 Dec : ๋ํ์ ์ํ ์์
์ฌํด๋ ๊ฐ์ธ์ ์ผ๋ก๋ ์ฃผ๋ณํ๊ฒฝ์์๋ ๋ญ๊ฐ ๋ง์ ๊ฒ๋ค์ด ๋ฐ๋๊ฒ ๊ฐ์ต๋๋ค.
2022 Jan - July : Internship @ Aigendrug. Co. Ltd
์ง๋ํด ๋ง โ์ฐฝ์์ ํตํฉ ์ค๊ณโ ๊ณผ๋ชฉ์ ํ๋ก์ ํธ๊ฐ ์ธ์ฐ์ด ๋์ด, ์์ธ๋ํ๊ต ๊น์ ๊ต์๋๊ป์ ์ฐฝ์ ํ์ Aigendrug ์ธ๊ณต์ง๋ฅ ์ ์ฝ๊ฐ๋ฐ ์ฐ๊ตฌ์ ์์ 12์๋ถํฐ 7์๊น์ง research internship์ ์ฐธ์ฌํ์์ต๋๋ค. Aigendrug์ machine learning / deep learning ์ ํตํด ์ฝ๋ฌผ ๋ถ์๋ ๋จ๋ฐฑ์ง์ ํํ์ , ์๋ฌผํ์ ํน์ฑ์ ์ดํดํ๊ณ , ์ด๋ฅผ ์ด์ฉํ์ฌ ์ฝ๋ฌผ์ ํจ๊ณผ์ ๋ถ์์ฉ ์์ธก, ์ ์ฝ๊ฐ๋ฐ ๋ฑ์ ๋ชฉํ๋ก ํ๋ ์ธ๊ณต์ง๋ฅ ์ ์ฝ๊ฐ๋ฐ ๋ฒค์ฒ๊ธฐ์ ์ ๋๋ค.
์ ๋ ์ด๋์ฏค ์ง๊ธ ์ ๊ฐ ์๋ ์์ธ๋ํ๊ต ์ปดํจํฐ์ด๋ก ์ฐ๊ตฌ์ค๋ก์ ์งํ์ ๋ํด ๋ฉด๋ด ๋ฑ์ผ๋ก ์ฌ์ค์ ๊ฒฐ์ ์ ํด๋ ์ํ์๊ณ , ๋ํ์ ์งํ ์ ์๋๋ ๊ธฐ์ ์ธํด์ญ ๋ฑ์ ํตํด ์กฐ๊ธ ๋ค๋ฅธ ๊ฒฝํ์ ํด๋ณด๊ณ ์ถ์์ต๋๋ค. ๊ทธ๋์ ํ ํ๊ธฐ๋ฅผ ํดํํ ๊ณํ์ ํ๋๋ฐ, ํดํํ์ง ์๊ณ ๋ ์ธํด์ญ๊ณผ ํ์ ์ ๋ณํํ ์ ์๋ ์ข์ ๊ธฐํ๊ฐ ๋ ๊ฒ ๊ฐ์ ์๋ก์ด ๋ถ์ผ์๋ ๋์ ํด๋ณผ ์๊ฐ์ ํ๊ฒ ๋ ๊ฒ ๊ฐ์ต๋๋ค. ๊ณ๊ธฐ์ ๋ํด์๋ ์ง๋ํ๊ธฐ ์ด ์์ฑํ๋ ๊ธ ์์ ์๊ฐํ๋ ๊ฒ์ด ๊ฐ์ฅ ์์งํ๊ฒ ๊ฐ์ต๋๋ค.
ํํ๊ธฐ ๋์ Bio/Cheminformatics ๋ถ์ผ์ ์ฐ๊ตฌ๋ฅผ ์ ๋ํ์๋ ๊น์ ๊ต์๋๊ณผ, ์ ์ฐ๊ตฌ์ค ์ ๋ฐฐ๋์ด๊ธฐ๋ ํ ์ด์ ํธ ๋ํ๋์ ๋น๋กฏํ ํ์ฌ ๋ถ๋ค, ์์ธ๋ํ๊ต BHI ์ฐ๊ตฌ์ค์ ๊ตฌ์ฑ์๋ค๊ณผ ํจ๊ปํ๋ฉฐ ๊ธฐ์กด์๋ ์กด์ฌํ๋์ง๋ ๋ชฐ๋๋ ๋ฌธ์ ๋ฅผ ์๋ก์ด ์ ํด ๋ณผ ์ ์์๊ณ , ์๊ณ ๋ฆฌ์ฆ ์ฐ๊ตฌ์ ํ์ค ๋ฌธ์ ์ฌ์ด์ ๋ฌด์์ด ์๋์ง๋ ์กฐ๊ธ์ ๋๋ ์ ์์์ต๋๋ค. ์ค์ ๋ฐ์ดํฐ์ ๋ํด ๋ฌธ์ ๋ฅผ ํผ๋ค๋ ๊ฒ์ด ์ด๋ค ์๋ฏธ์ธ์ง, ํ๊ต์์ ๋ฐฐ์ด Toy dataset๊ณผ๋ ์ด๋ป๊ฒ ๋ค๋ฅธ์ง์ ๋ํด ๋ค์ ์๊ฐํ๊ฒ ๋ ๊ฒ๋ ์ค์ํ ํฌ์ธํธ์ธ๊ฒ ๊ฐ์ต๋๋ค.
์ฐ๊ตฌ์ ๋ํด์๋ ์ถํ ํ๋ก์ธ์ค๊ฐ ๋ชจ๋ ๋๋๊ธฐ ์ ๊น์ง๋ ์์ธํ ๋ ผ์ํ ์ ์์ง๋ง,
- ๋ถ์ ๊ทธ๋ํ์์ Subgraph matching ๋ฌธ์ ๋ฅผ ๋น ๋ฅด๊ฒ ํธ๋ ๋ฐฉ๋ฒ (ํด๋ฆฌ์คํฑ)
- Random walk๋ฅผ ์ด์ฉํ ๋ถ์์์์ ๋ ์ฑ ์ฌ๋ถ ํ๋จ์ ์ํ subgraph mining ๋ฑ์ ํ๋ก์ ํธ์ ์ฐธ์ฌํ์ต๋๋ค. ์ถ๊ฐ๋ก, ๋ณธ๋ ๊ณํ์๋ ์์์ง๋ง Molecular Multimodal Contrastive Learning์ ๋ํ ํ๋ก์ ํธ์๋ ์ฐธ์ฌํด๋ณผ ๊ธฐํ๊ฐ ๋์์ต๋๋ค.
์ปดํจํฐ์ด๋ก ์ฐ๊ตฌ์ค์์ ๋ ํํ๊ธฐ๋ฅผ ๋ณด๋ธ ์ง๊ธ ๋ค์ ์ด๋ ํ๋๊ฒ๋ค์ ์๊ฐํ๋ฉด ์ฐ๋ฆฌ๊ฐ ์๊ณ ๋ฆฌ์ฆ์ ์ผ๋ก ์ ํ ์ ์๋ ๋ฌธ์ ์ ์์ฉ๋ถ์ผ์ ์ค์ ๋ฌธ์ ์ฌ์ด๊ฐ ์ผ๋ง๋ ๋ฉ๋ฉด์๋ ๊ฐ๊น์ด์ง ๋๋ผ๊ฒ ๋ฉ๋๋ค. Subgraph Mining์ ์์ญ๋ ๊ฐ ์์์ด ๋ง์ ์ฐ๊ตฌ๊ฐ ์งํ๋๊ณ ์์ง๋ง ์์ง ๊ฐ ๊ธธ์ด ๋ฉ์ด ๋ณด์ ๋๋ค. ์ด๋ค subgraph๋ฅผ miningํ ์ง์ ๋ฐ๋ผ, ๋ ์์ฉ ๋ถ์ผ๊ฐ ๋ฌด์์ด๊ณ ๊ทธ๋ก๋ถํฐ ์ป์ด์ง๋ ๋ฐ์ดํฐ์ ์ ์ฝ์กฐ๊ฑด์ด ๋ฌด์์ด๋์ ๋ฐ๋ผ ์ฌ์ค ์์ ๋ค๋ฅธ ๋ฌธ์ ๊ฐ ๋๊ธฐ ๋๋ฌธ์ ๊ทธ๋ฐ๊ฒ ์๋๊ฐ ์ถ์ต๋๋ค.
์ง๋๋ฒ์๋ ์ผ๋ ๋ง์ด์ง๋ง, ์ด๋ก ๋ถ์ผ๋ก ๋์๊ฐ ์ ๋ก์จ๋ ์ด๋ฐ ๋ฌธ์ ๋ฅผ ๋ค์ํ ๊ด์ ์์ ์ ๊ทผํ๊ณ , ๋ Fundamentalํ ๋ฌธ์ ์ ๋ํ ๊ธฐ์ด์ ์ธ ์ฐ๊ตฌ๊ฐ ์์ฉ๋ถ์ผ์ ๋ฐ๋ก ์ ์ฉ๊ฐ๋ฅํ๋ค๋ ์ ์ด CS์ ๋งค๋ ฅ ์ค ํ๋๋ผ๊ณ ์๊ฐํฉ๋๋ค. ๋ค๋ง ์์ผ๋ก 2๋ ์ฌ ๊ฐ์ ์ข๋ ๋ด๊ณต์ ์๊ณ ์๋ก์ด ์๊ณ ๋ฆฌ์ฆ์ ์ ๊ทผ์ ์๋ํ๋๋ฐ ์ฃผ๋ ฅํด๋ณด๊ณ ์ ํฉ๋๋ค.
2022 Spring Semester : ํ๋ถ ๋ง์ง๋ง ํ๊ธฐ
์์ ์ ๋ญ ํ์๋ ๋น์ทํ์ต๋๋ค. ๋ดํ๊ธฐ Aigendrug ์ธํด์ญ์ ์ฌ์ค์ ๋ํ์์ํ๊ณผ ๋น์ทํ๊ธฐ ๋๋ฌธ์, ์์ ๋ ์ฝ์ค์ ๋ฃ๋ ๋๋์ผ๋ก ๋ค์์ต๋๋ค (์ค์ ๋ก ์ ๊ณต๊ณผ๋ชฉ ๋๊ฐ๋ ๋ค ๋ํ์ ๊ณผ๋ชฉ์ด๊ธฐ๋ ํฉ๋๋ค) ๊ทธ๋ฌ๋ ์ฌ๊ธฐ์ ์กธ์ ์ ์ํด ๊ต์๊ณผ๋ชฉ์ 2๊ฐ ์ฑ์ฌ๋ฃ์ด์ผ ํ๋ค๋ ์ ์ ์ข ํ๋ค์์ต๋๋ค. ์ ์ด์ ๋ ํ๊ธฐ๋ก ๊ณํํ๋ ์กธ์ ์ ๋น๊ฒจ์ ์๊ธด ์ผ์ ๋๋ค.
- ๊ต์ 2๊ฐ : ์ฌ๋ฐ์ด ๋ณด์ด๋ ๊ต์์ ํํ๊ณ ์ถ์๋๋ฐ ์ฌํ์ ์์ ์ ํ๋์ฉ ๊ณจ๋ผ์ผ ํด์, ๋ ธ๋๊ณผ ๋ฒ / ๋์๊ฑด์ถ์ ์ก์์ต๋๋ค. ๋ฐ์ ์ผ์์ ํ๋ง์ด ๋๊ธธ ๋ฐ๋ฌ์ง๋ง ์ฌ์ค ์์ธ์ด์ฐ๋๊ฒ ๋ค๋ฅธ ๊ณผ์ ๋ณด๋ค ๋ ํ๋ค์๋๊ฒ ๊ฐ์ต๋๋ค. ๊ฑด์ถ์์ ์ ๋๋ฌด ๋ฐ์์ง ์์์ ๋์๋ ๋ฐ์ ๋๊ฐ์ ์ค์ ๋ก ๋ต์ฌ๋ ํ๊ณ ํ๋ ๊ณผ๋ชฉ์ด๋ผ ์ฌ๋ฐ์๋๋ฐ, NeurIPS ์ ์ถ due date๊ฐ k์ผ ๋จ์๋๋ฐ ๊ธ์์ผ ์คํ์ ์์ธ ์ ํธ ์ด๋๊ฐ๋ฅผ ํฅํด ๋ฒ์ค๋ฅผ ํ๊ณ ๊ฐ๋ฉฐ ์ด๊ฒ ๋ง๋ ํ๋ ์๊ฐ์ ํ๋ ๊ธฐ์ต์ด ์์ต๋๋ค. ๋์ด์ผ๋ณด๋ฉด ์ฌ๋ฐ๋ ์๊ฐ์ด์๋ค๊ณ ์๊ฐํฉ๋๋ค.
- ์๋ฌผ์ ๋ณดํ์ ์ํ ๊ธฐ๊ณํ์ต : ML ์์ฉ ๊ณผ๋ชฉ์ผ๋ก, HMM / EM (Gaussian Mixture) ๋ฑ ๋จธ์ ๋ฌ๋ ๋ด์ฉ์ Bioinformatics ๋ผ๋ context์์ ๋ฐฐ์ ์ต๋๋ค. ์ ๊ฐ ์ธํด์ญํ๋ ๋ถ์ผ๋์ ํฌ๊ฒ๋ณด๋ฉด ์ฐ๊ด์ด ์์ง๋ง ์ฌ์ค ์กฐ๊ธ ๋๋์ด ๋ฌ๋๋๋ฐ, ์ ๊ฐ ML์ ๋ฅ๋ฌ๋๋ถํฐ ๋ฐฐ์์ ๊ณ ์ ์ ์ธ ML ๊ธฐ๋ฒ๋ค์ ๋ํ ์ดํด๊ฐ ์ข ๋ถ์กฑํ๊ณ ๊ทธ๋ฐ๊ฒ๋ค์ ์ข ์ฑ์์ผ๊ฒ ๋ค๋ ์ฌ์ค์ ๊นจ๋ซ๊ฒ ํด์ฃผ์์ต๋๋ค. Sequence alignment ๋ฑ ์๋ก์ด ๋ฌธ์ ๋ ์ ํด๋ณผ ์ ์์์ต๋๋ค. Bioinformatics์ ๋ํด์๋ ๋์ค์ ๋ฐ๋ก ๊ณต๋ถํ ์ผ์ด ์์ ๊ฒ ๊ฐ๊ธฐ๋ ํฉ๋๋ค.
- ์์ฉ์ํํน๊ฐ - Infinitely wide neural network : ๋ฅ๋ฌ๋, ๋ด๋ด ๋คํธ์ํฌ์ ๊ธฐ๋ฐ์ ์ด๋ฃจ๋ ์ด๋ก ์ ๋ํ ์๋ฆฌ๊ณผํ๋ถ ๋ํ์ ๊ณผ๋ชฉ์ ๋๋ค. ์ง๊ธ๊น์ง ์ํ๊ณผ ํ๋ถ์์ ๋ฐฐ์ด ๋ชจ๋ ํด์ํ + ์์ + ํ๋ฅ ๋ก + ์ต์ ํ ๋ด์ฉ์ Prerequisite ์ผ์, ๋ฅ๋ฌ๋์ ๋ฒ ์ด์ค๋ฅผ Uniform Approx Theorem๋ถํฐ Neural Tangent Kernel, Mean Field Theory ๋ฑ ํ๋์ฉ ํ๋์ฉ ์์๊ฐ๋๋ค. Convex Optimization์ ์ด์ด, Optimal Transport ๋ฑ ๋ด์ฉ์ ๋ฐฐ์ฐ๋ฉด์ โ๋ด๊ฐ ๊ทธ๋ํ์ชฝ์ ๊ณต๋ถํ๊ธฐ๋ก ๊ฒฐ์ ํ์ง ์์๋ค๋ฉด ์ด๊ฑธ ํ๊ณ ์์ง ์์๊นโ ํ๋ ์๊ฐ์ด ๋ค์์ต๋๋ค. ์ธ์ ๊ฐ ๋ค์ ๋ณผ์ผ์ด ์์์ง๋ ๋ชจ๋ฅด๊ฒ ์ง๋ง, ์ํ์ ์ ๋ณต์ ํ๋์ง์ ๋ํ ๋๋ฆ์ ํด๋ต์ด ๋ ๊ฒ ๊ฐ์ ์๋ฏธ์๊ฒ ์๊ฐํฉ๋๋ค.
2022 Aug - 2022 Dec : ๋ํ์ ์ํ ์์
ํ๋ถ 3ํ๋ ๋ UROP (ํ๋ถ์ ์ฐ๊ตฌ์ฐธ์ฌ ํ๋ก๊ทธ๋จ) ์ฐธ์ฌํ๋ฉด์๋ถํฐ ์งํ์ ๊ณ ๋ฏผํ๋ ์์ธ๋ํ๊ต ์ปดํจํฐ์ด๋ก ๋ฐ ์์ฉ ์ฐ๊ตฌ์ค ์์ ์์ฌ๊ณผ์ ์ ์์ํ๊ฒ ๋์์ต๋๋ค. ์์ง์ ์์ธํ ๋งํ๊ธด ๊ทธ๋ ์ง๋ง ๋๋ฆ ํฅ๋ฏธ๋ฅผ ๊ฐ๊ณ ์๋ ๋ถ์ผ์์์๋ ์งํ์ ๋ง์ง๋ง๊น์ง ๊ณ ๋ฏผํ๊ฒ ํ๋ ์ฌ๋ฌ ๋ฌธ์ ๋ค (์ฃผ๋ก ๋ณ์ญ์ ๊ดํ, ๊ทธ๋ฆฌ๊ณ ๋ถ๋ถ์ ์ผ๋ก ์ง๋ก์ ๊ดํ) ์ด ์์๋๋ฐ, ๋๋ฌด ๋ง์ ๊ณ ๋ฏผ์ ํฉ์ธ์ฌ ์๋ ๊ฒ๋ณด๋ค๋ Greedyํ๊ฒ ๋์๊ฐ๋๊ฒ ๋์ ๋ฐฉ๋ฒ์ด๋ผ๋ ์๊ฐ์ด ๋ค์์ต๋๋ค.
์ฒซ ํํ๊ธฐ๋ ๊ฝค ํ๋ณตํ๊ฒ ๊ฐ์ต๋๋ค. ๋๋ฆ๋๋ก ์ฐ๊ตฌํด๋ณด๊ณ ์ถ์ ์ฃผ์ ๋ ์๊ฐํด๋ณผ ์ ์์๊ณ , ๋ค์ํ๊ฒ ๋ ผ๋ฌธ๋ ์ฝ์ด๋ณด๊ณ , ๊ฐ์ ๋ถ์ผ ๋น์ทํ ๋ฌธ์ ๋ฅผ ๊ณ ๋ฏผํ๋ ์ ๋ฐฐ๋ค๊ณผ ํจ๊ปํ๊ณ ์์ด ๋งค์ผ ๋ง์ด ๋ฐฐ์ฐ๊ณ ์์ต๋๋ค.
-
Coursework : ์ ๋ ์๊ต ํ์ฌ -> ์์ฌ ์งํ์ด๋ผ ํ๋ถ๋ ์๊ฐํ ๊ณผ๋ชฉ์ ์ธ์ ๋ฐ์ ์ ์์ด์, ํธ์ํ ๋ง์์ผ๋ก ์ด์๊ท์ ์ ํฌ๊ฒ ๊ฐ์์น ์๊ณ ๋ค์ด๋ณด๊ณ ์ถ์๊ฑธ ๊ณจ๋์ต๋๋ค. ๋ค๋ง ์ ํ๊ธฐ์ ์ํ ์ธ์ ๋ค๋ฅธ ๊ฒ๋ค ๋ก ๋๋ฌด ๋ง์ ์๊ฐ์ ์ด๊ฒ ๊ฐ์ ์ด๋ฒ์๋ ๋ฐ๋๋ก ์ํ ์ธ์๋ ๋ฑํ ํ๊ฐ๊ฐ ์๋ ๊ณผ๋ชฉ์ ๊ณจ๋ผ์, ์ํ๋๋ ์กฐ๊ธ ํผ๊ณคํ๋๊ฒ ๊ฐ์ต๋๋ค.
- ํ๋ฅ ๋คํธ์ํฌ ๋ชจ๋ธ๋ง : ๋คํธ์ํฌ๋ฅผ ์ฐ๊ตฌํ์๋ ๊ต์๋๊ป์ ๊ฐ์ํ์์ง๋ง, ์ฌ์ค ๋คํธ์ํฌ๋์ ๋ณ ์๊ด์ด ์๊ณ Queueing theory๋ฅผ ๊ฐ์ํ๋ ์ด๋ก ๊ณผ๋ชฉ์ ๋๋ค. ์์ผ๋ก Randomized algorithm ๊ฐ์ ๊ฒ๋ค์ ๊ณต๋ถํ๋๋ฐ queueing theory๋ฅผ ์๋ฉด ์กฐ๊ธ ๋์์ด ๋์ง ์์๊น ํ๋ ์๊ฐ์ ์ ํํ์ต๋๋ค. ๊ธฐ๋ง๊ณ ์ฌ๋๋ ๊ณต๋ถ๊ฐ ์ข ๋ถ์กฑํ์ง๋ง ๋ด์ฉ์ ๊ธฐ๋ํ๋ ๋๋ก์๋์ต๋๋ค.
- ํจํด ์ธ์ : Deep Learning ์ด์ ์๋ ML, ํนํ Bayesian ๊ธฐ๋ฒ๋ค์ ์ด์ ์ ๋ง์ถ ์์ ์ ๋๋ค. ์ ๋ฐ์ ์ผ๋ก Bishop์ ์ฑ PRML ๋ด์ฉ์ ์ผ๋ถ๋ฅผ ๋ค๋ฃจ๋๋ฐ, ๋์ค๊ฐ ๊น๋ค๊ธฐ๋ณด๋ค๋ ๋ค์ํ๊ฒ ๋ง์ด ๋ฐฐ์ฐ๋ ๊ธฐํ๊ฐ ๋์์ต๋๋ค. ML์ ๋ง์ด ์์๋ก ์ข์๊ฑฐ ๊ฐ์์ ์๊ฐํ๋๋ฐ, ์ค์ ํ๋ก์ ํธ๊ฐ ์๋ ๊ณผ๋ชฉ์ ํ๋์ฏค ๋ ๋ค์ด๋ณด๋๊ฒ๋ ๊ด์ฐฎ๊ฒ ๋ค๋ ์๊ฐ์ด ๋ค์์ต๋๋ค.
- ์ฐ๊ตฌ ์ค๋ฆฌ์ ์ดํด : โCVPR ํ์ ์ฌํโ ์ดํ ๋ํ์ ์ ์ ์๋ค์๊ฒ ์๊ฐ์ด ์๋ฌดํ๋์์ต๋๋ค. Silence is golden.
- Research : Submit ๋๋ Publish ์ดํ์ ์ธ๊ธํ๊ฒ ์ง๋ง, ์ ๋๋ฆ๋๋ก๋ ์ฌ๋ฐ์ด ๋ณด์ด๋ ์ฃผ์ ๋ฅผ ์ก๊ณ ๊ณ ๋ฏผํด๋ณด๊ณ ์์ต๋๋ค. :) ์ฌ๋ฐ๊ฒ(?) ์ฝ์๋ ๋ ผ๋ฌธ๋ค ๋ช๊ฐ์ ๋๋ ๋์ค์ ์งง๊ฒ๋ผ๋ ์ ๋ฆฌํด๋ณด๋ ค๊ณ ํฉ๋๋ค.