김광현

오늘 모르면 내일은 아는 개발자 김광현입니다

About Me

오늘 모르는게 생기면 내일은 알고 있는 신입 개발자 김광현입니다.

Java로 처음 개발공부를 시작했고 안드로이드 프로젝트 경험, 웹 서버 프로젝트 경험으로 Full stack을 공부했습니다. 데이터 엔지니어링이 제가 목표로 하는 백엔드 개발이라는 확신이 들어 전문적인 데이터 엔지니어가 되기위해 공부하고 있습니다. 현재 빅 데이터스트림 데이터 수집, 저장, 처리, 분석, 시각화까지 데이터 분석의 전체 과정에 걸친 데이터 파이프라인 구축을 공부하고 있습니다.

데이터 엔지니어링을 공부하면서 오픈소스 학습 내용이나 기타 데이터 엔지니어링 학습 과정을 블로그에 꾸준히 게시하고 있습니다.

Skills

Backend

  • Python, PHP, Java
  • Apache Spark, Apache Airflow, Apache Kafka, Apache Flink
  • Laravel, Composer
  • MVP

Devops

  • Linux
  • Nginx, Apache
  • AWS EC2, AWS S3
  • MySQL

Frontend

  • Html / CSS
  • JS, Jqeury
  • Json, Ajax

Experience

(주)델리아이

백앤드 개발 외주 프리랜서 계약

2021.10 - 2021.11

http://deliiglobal.com

웹 페이지 백앤드 개발을 맡아했습니다.

퍼블리싱 된 프론트에 기능을 추가하고 서버에서 필요한 데이터를 가져와 뿌려주는 작업을 했습니다. 카카오맵 API를 사용해 다중오버레이 작업을 했고, 폴더에 저장된 텍스트 파일을 한줄씩 읽어와 데이터를 뿌려주는 기능을 구현했습니다. 개발자체는 어렵지 않았지만 처음으로 누군가가 요구하는 기능을 만들면서 개발과정에서 소통의 중요성을 이해할 수 있었던 시간이었습니다.

사용 기술 요약

  • PHP Laravel Framwork
  • KakaoMap API

Projects

데이터 엔지니어링 학습 포트폴리오

2022.03 - 2022.05

github.com/devkhk/data-engineering-study

우버 모빌리티 데이터로 실시간 빅데이터 처리를 실습하면서 ETL 방식에서 ELT 흐름으로 넘어가는 모던 데이터 엔지니어링 아키텍쳐를 학습.

과거 데이터와 실시간 데이터를 기반으로 배치 파이프라인스트림 파이프라인을 동시에 사용하는 ML 데이터 학습과 서빙 파이프라인을 설계합니다. 오케스트레이션 데이터 엔지니어링 스케쥴링 이해, 학습

사용 기술 요약

  • Apache Spark
    • 배치 데이터 분석
    • Data Preprocessing
    • Hyper Parameter 파이프라인
    • ML 예측 모델 학습 파이프라인
  • Apache Airflow
    • 배치 데이터 가공, 저장 파이프라인 DAG 설계
    • Data Preprocessing -> Train/Test 데이터 저장
    • Hyper Parameter 학습 -> 파라미터 csv 파일로 저장
    • Train Model -> 학습 된 모델을 저장
    • 위 과정을 에어플로우 DAG의 작업화(Task) 하고 의존성 추가
  • Apache Kafka
    • 카프카 실시간 빅데이터 처리 실습
    • 카프카를 활용한 Fraud Detection Sub Project
  • Apache Flink
    • 스트림 데이터 프로세싱 실습
    • 플링크를 활용한 Twitter API RealTime Stream Process Sub Project
    • 배치 데이터 모델을 실시간 택시비 예측에 사용하기

KHK-Market

메이플 스토리 경매장을 모티브한 게임 아이템 경매장

2021.04 - 2021.05

github.com/devkhk/khk-market

건강상의 문제로 약 1년여만에 개발 공부를 다시 시작하게 된 후 제작한 웹 사이트입니다. 휴식기간 동안 가끔 즐기던 게임인 메이플스토리의 경매장을 모티브삼아 웹사이트로 만들어보았습니다. 개발 목적은 개발에 대한 감각을 되살리고 여러가지 조건에 쿼리문을 다양하게 적용해보고 싶었습니다. 자세한 내용은 깃허브에 정리해두었습니다.

사용 기술 요약

  • bootstrap5
  • PHP PDO
  • DB transaction, DB triger

My_web

처음 웹서버를 공부하면서 만든 블로그 웹입니다.

2020.02 - 2021.03

github.com/devkhk/my_web

웹 서버를 처음 구현하면서 백엔드에 대한 이해가 생기는 좋은 시간이었습니다. 직접 APM을 구성하고 리눅스에서 터미널 명령어를 다뤄보면서 내가 개발고수가 된 느낌이 들면서 이때부터 백앤드 개발자가 되어야겠다고 다짐했습니다. 자세한 내용은 깃허브에 정리해두었습니다.

사용 기술 요약

  • CRUD
  • 세션, 쿠키
  • SMTP 이메일 서비스
  • 댓글 : disqus API
  • 스팸방지 : recaptcha2 API
  • Summernote : ajax 다중이미지 처리
  • 썸네일 : 이미지 압축

Education

우버 모빌리티 데이터로 실시간 빅데이터 처리 실습

2022.03 - 05

수료증
  • 실무 데이터 처리의 End - End 학습
  • 우버 모빌리티 데이터로 실시간 빅데이터 처리 실습
  • 일괄처리 VS 실시간 빅데이터 처리 비교 학습
  • 오케스트레이션으로 데이터 엔지니어링 스케쥴링 학습

부스트코스 AI Basic 코칭스터디 1기 리드 부스터 수료

네이버 컨넥트재단에서 운영하는 인공지능 교육 프로그램 중 AI기초

2022.01 - 02

리더 수료증
  • 인공지능 전반에 필요한 기초 습득
  • 머신러닝을 위한 라이브러리 Numpy, Pandas 등을 이해하고 구현
  • 머신 러닝 알고리즘에 대한 이해
  • 자기 주도적 학습, 팀 학습, 코칭 결합된 스터디

패스트 캠프 클라우드를 활용한 데이터 파이프라인 구축

데이터 수집, 저장, 처리, 분석, 시각화까지 모든 단계의 파이프라인 구축

2021.12 - 2022.01

  • 데이터 파이프라인 전체 과정 커버
  • AWS와 Spark를 포함한 다양한 툴 활용
  • AWS 운영, 코스트 최적화 노하우
  • 실무와 유사한 환경 실습

네이버 컨넥트재단 부스트코스 컴퓨터 과학 CS50

하버드 대학교의 컴퓨터과학 입문 강좌

2021.12

수료증
  • 컴퓨터 과학의 기초 개념 이해
  • C를 이용한 배열, 자료구조, 알고리즘 실습
  • 프로그래밍에 필요한 컴퓨팅 사고 향상
  • CS강의 블로그 정리

동양 미래 대학교

전자정보공학과

2017 - 2019

  • 4.39/4.5 졸업