Devops/AWS

[AWS λΉŒλ”μŠ€] CloudWatch둜 λͺ¨λ‹ˆν„°λ§ μ†μ‰½κ²Œ μ‹œμž‘ν•˜κΈ°

sehaan 2024. 2. 19. 01:21

 

λͺ¨λ‹ˆν„°λ§κ³Ό κ΄€μ°° κ°€λŠ₯μ„±

λͺ¨λ‹ˆν„°λ§μ€ μ‹œμŠ€ν…œμ΄ μ œλŒ€λ‘œ λ™μž‘ν•˜λŠ” μ§€ ν™•μΈν•˜κΈ° μœ„ν•΄ 둜그 μ§€ν‘œ 좔적을 μˆ˜μ§‘ν•˜κ³  λΆ„μ„ν•œλ‹€.

κ΄€μ°°κ°€λŠ₯성은 μ‹œμŠ€ν…œμ΄ λΉ λ₯΄κ²Œ λ™μž‘ν•˜μ§€ μ•ŠλŠ” 이유λ₯Ό μ•Œ 수 μžˆλ‹€.

 

κ΄€μ°° κ°€λŠ₯성이 λͺ¨λ‹ˆν„°λ§ 포괄적인 μ˜λ―Έμ΄λ‹€.

 

AWS κ΄€μ°°κ°€λŠ₯μ„± 3κ°€μ§€ 필라(phillar) - 둜그, μ§€ν‘œ, 좔적

λͺ¨λ‹ˆν„°λ§μ—μ„œλ„ κ°€μž₯ μ€‘μš”ν•œ μš”μ†Œμ΄λ‹€.

 

ν΄λΌμš°λ“œ μ›ŒμΉ˜μ—μ„œλŠ” 3κ°€μ§€ 필라λ₯Ό 단일 ν”Œλž«νΌμ—μ„œ 확인가λŠ₯ν•  수 있으며, μ „체 μŠ€νƒμ„ λͺ¨λ‹ˆν„°λ§ ν•˜κ³  경보 둜그 및 이벀트 데이터λ₯Ό μ‚¬μš©ν•˜μ—¬ μžλ™ν™”λœ 쑰치λ₯Ό μ·¨ν•˜κ³  ν‰κ· ν•΄κ²°μ‹œκ°„(MTTR) 단좕할 수 μžˆλ‹€.

 

AWS κ΄€μ°°κ°€λŠ₯성을 AWS λ„€μ΄ν‹°λΈŒ μ„œλΉ„μŠ€ ν˜Ήμ€ μ˜€ν”ˆμ†ŒμŠ€ κ΄€λ¦¬ν˜• μ„œλΉ„μŠ€μ—μ„œ 확인 ν•  수 μžˆλ‹€.

 

 

 

 

ν΄λΌμš°λ“œ μ›ŒμΉ˜ λ™μž‘ 방식

ν΄λΌμš°λ“œ μ›ŒμΉ˜μ˜ λ™μž‘ 방식은 단계 λ³„λ‘œ κ΅¬λΆ„λœλ‹€.

1. μˆ˜μ§‘ λͺ¨λ‹ˆν„°λ§ 행동 뢄석

μˆ˜μ§‘μ€ 둜그 μ§€ν‘œ 이벀트 ν˜•νƒœλ‘œ λͺ¨λ‹ˆν„°λ§ 및 운영 데이터 μˆ˜μ§‘

 

2. λͺ¨λ‹ˆν„°λ§ μžλ™ν•˜λœ λ°μ‹œλ³΄λ“œλ‘œ μ‹œκ°ν™”

AWSλ¦¬μ†ŒμŠ€ μ–΄ν”Œλ¦¬μΌ€μ΄μ…˜ 및 μ„œλΉ„μŠ€λ₯Ό ν†΅ν•©μ μœΌλ‘œ λ³Ό 수 μžˆλ‹€.

 

3. ν–‰λ™μ—μ„œλŠ” μ§€μ •ν•œ μ§€ν‘œμ˜ μž„κ³„κ°’μ„ 기반으둜 경보λ₯Ό μƒμ„±ν•˜κ±°λ‚˜ 기계 ν•™μŠ΅ μ•Œκ³ λ¦¬μ¦˜μ„ 기반으둜 비정상 적인 μ§€ν‘œ λ™μž‘μ„ κ°μ‹œν•  수 μžˆλ‹€. 트리거둜 μžλ™λ™μž‘ , μ˜€ν† μŠ€μΌ€μΌλ§ -> MTTR 단좕

 

4. λΆ„μ„μ—μ„œλŠ” μ‹¬μΈ΅μ μœΌλ‘œ λΆ„μ„ν•˜μ—¬ μ„±λŠ₯ κ°œμ„ ν•œλ‹€.

 

μ•„λ§ˆμ‘΄ ν΄λΌμš°λ“œ μ›ŒμΉ˜λŠ” 기본적으둜 μ§€ν‘œ μ €μž₯μ†Œμ΄λ‹€.

 

μ •λ ¬λœ μ‹œκ³„μ—΄ μ§‘ν•©μœΌλ‘œ 검색 κ°€λŠ₯ν•˜λ©°, λ„€μž„ 슀페이슀 λ³„λ‘œ 격리λ₯Ό μ œκ³΅ν•˜κΈ° λ•Œλ¬Έμ— μ„œλ‘œ κ²©λ¦¬λ˜μ–΄μžˆμ–΄μ„œ λ‹€λ₯Έ μ–΄ν”Œμ˜ μ§€ν‘œκ°€ μ‹€μˆ˜λ‘œ λ™μΌν•œ ν†΅κ³„λ‘œ μ§‘κ³„λ˜μ§€λŠ” μ•ŠλŠ”λ‹€.

 

더 짧은 κΈ°κ°„μœΌλ‘œ κ²Œμ‹œλœ 데이터 ν¬μΈνŠΈλŠ” μž₯κΈ° 보관을 μœ„ν•΄ 집계

ex) 1λΆ„ μ„ΈλΆ„ν™” 데이터λ₯Ό ν‘œμ€€ λΆ„ν•΄λŠ₯으둜 μ €μž₯ , 1λΆ„ λ―Έμ•ˆμ€ 1초 μ„ΈλΆ„ν™” 데이터λ₯Ό κ³ λΆ„ν•΄λŠ₯으둜 μ €μž₯

-> AWS μ„œλΉ„μŠ€μ— μ˜ν•΄ μƒμ„±λ˜λŠ” μ§€ν‘œλŠ” 기본적으둜 ν‘œμ€€ λΆ„ν•΄λŠ₯ (1λΆ„ λ―Έλ§Œμ€ κ³ λΆ„ν•΄λŠ₯ μ‚¬μš©μž μ§€ν‘œ)

 

κ³ λΆ„ν•΄λŠ₯은 μ–΄ν”Œλ¦¬μΌ€μ΄μ…˜μ˜ λ‹¨κΈ°ν™œλ™μ„ 보닀 μ¦‰κ°μ μœΌλ‘œ κ΄€μ°° κ°€λŠ₯

λ°±λΆ„μœ„ μˆ˜λŠ” μ§€ν‘œ λ°μ΄ν„°μ˜ 뢄포λ₯Ό μ •ν™•ν•˜κ²Œ μ΄ν•΄ν•˜λŠ”λ° 도움

둜그 슀트림

둜그 이벀트의 λ™μΌν•œ μ†ŒμŠ€λ₯Ό λ¬Άμ–΄μ„œ 둜그 μŠ€νŠΈλ¦Όμ„ 이룬닀. 둜그 슀트림 μˆ˜μ—λŠ” μ œν•œμ΄ μ—†λ‹€.

둜그 μ €μž₯ λΉ„μš©μ΄ λΆˆν•„μš”ν•˜κ²Œ λ°œμƒν•  수 있기 λ•Œλ¬Έμ— 둜그 그룹의 성격에 맞게 μ μ ˆν•œ 둜그 보쑴 섀정이 ν•„μš”ν•˜λ‹€.

 

μ—μ΄μ „νŠΈλŠ” μ—μ΄μ „νŠΈ , μ§€ν‘œ , 둜그 , 좔적이 μžˆλŠ” JSON νŒŒμΌμ„ 톡해 확인 κ°€λŠ₯ν•˜λ‹€.

 

λ‹€μ–‘ν•œ μš΄μ˜μ²΄μ œμ— μ„€μΉ˜ κ°€λŠ₯, 운영 체제 μ „λ°˜μ— 걸쳐 λ‚΄λΆ€ μ‹œμŠ€ν…œ μˆ˜μ€€μ˜ μ§€ν‘œ μˆ˜μ§‘ κ°€λŠ₯ν•˜λ©°,

AWS κ°€ κ΄€λ¦¬ν•˜μ§€ μ•ŠλŠ” μ„œλ²„ 뿐만 μ•„λ‹ˆλΌ ν•˜μ΄λΈŒλ¦¬λ“œ ν™˜κ²½μ˜ μ„œλ²„λ„ ν¬ν•¨ν•œλ‹€.

 

statsD collected ν”„λ‘œν† μ½œμ„ μ‚¬μš©ν•˜μ—¬ μ–΄ν”Œλ¦¬μΌ€μ΄μ…˜ λ˜λŠ” μ‚¬μš©μž μ§€μ • μ§€ν‘œλ₯Ό 검색할 수 μžˆλ‹€.

μ§€ν‘œ μ„Ήμ…˜μ€ ν΄λΌμš°λ“œ μ›ŒμΉ˜μ—μ„œ κ²Œμ‹œν•  μ‚¬μš©μž μ§€μ • μ§€ν‘œλ₯Ό μ§€μ •ν•  수 μžˆλ‹€.

 

 

μΈμ‚¬μ΄νŠΈ

ν΄λΌμš°λ“œ μ›ŒμΉ˜ 둜그 μΈμ‚¬μ΄νŠΈλŠ” ν†΅ν•©λœ μΈν„°λ ‰ν‹°λΈŒ 둜그 뢄석, λ‘œκ·Έλ°μ΄ν„°λ₯Ό λŒ€ν™”μ‹μœΌλ‘œ κ²€μƒ‰ν•˜κ³  뢄석할 수 μžˆλ‹€.

잠재적인 원인을 μ‹λ³„ν•˜κ³  배포된 μˆ˜μ •μ‚¬ν•­μ„ 확인할 수 μžˆλ‹€.

 

 

μ»¨νŠΈλ¦¬λ·°ν„° μΈμ‚¬μ΄νŠΈ

λ‘œκ·Έλ°μ΄ν„° 뢄석 기고자 데이터λ₯Ό ν‘œμ‹œν•˜λŠ” μ‹œκ³„μ—΄ 생성

μƒμœ„ n개의 κΈ°μ—¬μž 총 고유 κΈ°μ—¬μž μ‚¬μš©λŸ‰ 데이터 

 

잘λͺ»λœ 호슀트 μ°ΎκΈ° , μ‚¬μš©λŸ‰μ΄ κ°€μž₯ λ§Žμ€ λ„€νŠΈμ›Œν¬ 식별 , κ°€μž₯ λ§Žμ€ 였λ₯˜λ₯Ό λ‚΄λŠ” url 탐지가 κ°€λŠ₯ν•˜λ‹€.

 

μ»¨ν…Œμ΄λ„ˆ μΈμ‚¬μ΄νŠΈ

μ»¨ν…Œμ΄λ„ˆν™” 된 μ–΄ν”Œλ¦¬μ—μ΄μ…˜ 및 마이크둜 μ„œλΉ„μŠ€μ˜ μ§€ν‘œ 및 둜그λ₯Ό μˆ˜μ§‘ν•˜κ³  μš”μ•½ κ°€λŠ₯ ECS , EKS, EC2 ν™˜κ²½μ—μ„œλ„ μ‚¬μš© κ°€λŠ₯

Fargate λ¦¬μ†ŒμŠ€μ—μ„œλ„ 데이터 μˆ˜μ§‘ κ°€λŠ₯

 

CPU, λ©”λͺ¨λ¦¬ , λ””μŠ€ν¬, λ„€νŠΈμ›Œν¬ 같은 λ§Žμ€ λ¦¬μ†ŒμŠ€μ— λŒ€ν•œ μ§€ν‘œλ₯Ό μžλ™μœΌλ‘œ μˆ˜μ§‘

μ»¨ν…Œμ΄λ„ˆ μž¬μ‹œμž‘ 였λ₯˜ 같은 진단 정보λ₯Ό μž¬κ³΅ν•˜μ—¬ 였λ₯˜λ₯Ό 빨리 ν•΄κ²°ν•  수 μžˆλ„λ‘ λ„μ™€μ€Œ

 

μž„λ² λ””λ“œ μ§€ν‘œ ν˜•μ‹μ„ μ‚¬μš©ν•˜μ—¬ 데이터λ₯Ό μ„±λŠ₯ 둜그 이벀트둜 μˆ˜μ§‘

μ„±λŠ₯ 둜그 μ΄λ²€νŠΈλŠ” μΉ΄λ‹ˆλ„λ¦¬ν‹°κ°€ 높은 데이터λ₯Ό μ €μž₯ν•  수 있게 ν•˜λŠ” ꡬ쑰화 된 json을 μŠ€ν‚€λ§ˆλ₯Ό μ‚¬μš©ν•˜λŠ” ν•­λͺ©

 

firelensλŠ” fluent bit 및 fl vented와 ν•¨κ»˜ λ™μž‘ 

 

 

λžŒλ‹€ μΈμ‚¬μ΄νŠΈ

μ„œλ²„λ¦¬μŠ€ μ–΄ν”Œλ¦¬μΌ€μ΄μ…˜μ— λŒ€ν•œ λͺ¨λ‹ˆν„°λ§ 및 문제 ν•΄κ²° μ†”λ£¨μ…˜

Cpu, μ‹œκ°„, λ©”λͺ¨λ¦¬, λ””μŠ€ν¬ μ„±λŠ₯ 이벀트λ₯Ό μˆ˜μ§‘

μ‚¬μš©μž μ§€μ • μ§€ν‘œλ₯Ό μžλ™μœΌλ‘œ 생성

콜트 μŠ€νƒ€νŠΈ 및 λžŒλ‹€ μž‘μ—…μž μ’…λ£Œμ™€ 같은진단 정보λ₯Όμˆ˜μ§‘ 집계 μš”μ•½ , λžŒλ‹€ κ΄€λ ¨λ¬Έμ œλ₯Ό κ²©λ¦¬ν•˜κ³  μ‹ μ†ν•˜κ²Œ ν•΄κ²°ν•  수 μžˆλ„λ‘ 도와쀀닀.

 

μ‹œμŠ€ν…œ μˆ˜μ€€ μ§€ν‘œλ₯Ό μˆ˜μ§‘, λžŒλ‹€ ν•¨μˆ˜κ°€ 호좜될 λ•Œλ§ˆλ‹€ 단일 μ„±λŠ₯ 둜그 이벀트λ₯Ό 내보냄

 

ν΄λΌμš°λ“œ μ›ŒμΉ˜λŠ” 둜그 μ΄λ²€νŠΈμ—μ„œ μ§€ν‘œλ₯Ό μΆ”μΆœν•˜μ—¬μ„œ λžŒλ‹€ 인사이츠 λ„€μž„μŠ€νŽ˜μ΄μŠ€μ— ν•¨μˆ˜ μ΄λ¦„λ³„λ‘œ μ €μž₯

λžŒλ‹€ μΈμ‚¬μ΄νŠΈμ—μ„œλŠ” 닀쀑 ν•¨μˆ˜ κ°œμš”λ₯Ό λ³΄κ±°λ‚˜ 단일 ν•¨μˆ˜μ— 집쀑할 수 μžˆλ‹€.