데이터 엔지니어의 하루 2
Day 2 화요일 화요일 목요일은 유일하게 사무실에 출근하는 날들이라 평소보다 미팅이 많이 잡힐 때가 많다. 오전 8시 반쯤 사무실에 도착해 메일과 모니터링을 체크하고, 팀 미팅을 하기 전 논의할 것이 있는지 점검한다. 팀내 업데이트 화요일 아침 9시는 주간 팀 미팅으로 시작한다. 우리 팀은 데이터 엔지니어인 나와 data scientist, data analyst, market analyst, 그리고 매니저로 구성되어 있다. 각자 일주일동안 무엇을 했는지를 공유하면서 다른 팀이나 이사진들과 있었던 중요한 이야기나 조금 더 장기적인 비전 혹은 목표에 대한 이야기도 오가기 때문에 엄청 테크니컬 하지는 않다. 특히 애널리스트들이 이야기 할 때에면 나는 금융이나 무역쪽 도메인 지식이 부족해서 어렵게 들리기도 하지만, 대략적으로 내가 해온 것들이 어떻게 쓰이고 있는지, 혹은 현재 수작업으로 하고 있는 것들이 추후에 우리 데이터 플랫폼을 통해 어떻게 개선될 수 있을지를 파악하려고 하며 듣는 편이다. 프로젝트 아키텍쳐 디자인/조언 팀 미팅이 끝나고 쉴 새 없이 다음 미팅이 있는 곳으로 향했다. 다른 팀의 데이터 애널리스트, 엔지니어와 함께 프로젝트 아키텍쳐 디자인 한 것을 더 의논하고 컨펌하기 위해서였다. 다른 팀에서 관리하는 소스에서 데이터 플랫폼으로 어떻게 데이터를 ingest 할 지, 어떤 툴을 사용하여 transform하고 어떻게 output을 처리할지, 전체 파이프라인은 어떻게 trigger 할지 장단점과 특정 툴이나 방법을 선택한 정당성을 설명한다. 해당 팀 엔지니어는 가끔 필요하지 않은데 과하게 컴포넌트를 추가하려고 하는 경향이 있어 (예를들어 storage에 파일을 생성할때 파이프라인을 트리거 하도록 할 수 있는데 굳이 메시지 브로커를 사용하려 한다거나, 어차피 하루에 한번 배치로 처리하면 되는 프로세스 아웃풋을 유저가 pull 하도록 하면 간편한데 굳이 push하려 한다거나, 그렇다고 유지보수나 모니터링이 잘 돼있지도 않다ㅠㅠ) 이를 ...