CS/SRE

[SRE] 07. 구글의 발전된 자동화

12.tka 2023. 7. 26. 17:41
728x90

이번 장에서는 자동화의 가치 및 자동화를 대하는 우자세에 대한 변화에 대해 설명하고자 합니다.

 

1. 자동화의 가치

자동화의 진정한 가치는 무엇일까요? 

일관성

아무리 노력하더라도 사람이 기계처럼 일관성을 가지기란 불가능에 가깝습니다. 이처럼 예상치 못한 일정하지 못한 방식은 실수와 간과로 인해 데이터 품질의 문제를 유발하며, 결국 신뢰성의 문제로 발전하게 됩니다. 정확하게 정의된 업무 범위와 정해진 절차를 수행하는 데 있어 일관성의 가치는 다양한 측면에서 자동화가 최우선적으로 추구하는 가치입니다.

 

플랫폼

자동화 시스템은 확장이 가능하고 다른 시스템에도 적용이 가능하거나 심지어 이윤을 창출할 수 있는 플랫폼을 제공합니다. 이렇게 구축된 플랫폼은 실수를 중앙집중화하는 데도 도움이 됩니다. 엄청난 인력이 수동으로 동일한 절차를 수행하면 반복적으로 실수가 발생할 수 있는 것에 비해, 자동화된 코드 상에서 수정된 버그는 한 번 수정되면 다시는 발생하지 않습니다. 또한 추가 작업을 수행할 수 있도록 사람을 교육하는 것과 비교하면 플랫폼이 추가 작업을 실행할 수 있도록 확장하는 편이 훨씬 쉽습니다.

 

시간 절감

자동화된 시스템의 또 다른 이점은 시스템의 일반적인 장애를 해결하는 데 사용할 수 있다는 점입니다. 자동화 시스템이 충분히 정기적으로, 그리고 성공적으로 실행된다면, 통상적인 장애에 있어 평균 고장 후 수리 시간의 절감을 가져올 수 있습니다. 따라서 문제의 재발을 방지하거나 수리 후 정리 절차를 수행하는 등 남는 시간을 다른 곳에 활용할 수 있어 결과적으로 개발자의 업무 수행 속도 향상을 가져올 수 있습니다.

 

엔지니어들은 특정한 자동화 시스템이나 코드를 작성하는 것이 필요한 것인지를 판단할 때 어려움을 겪는 경우가 종종 있습니다. 특히 수동으로 실행되어야 할 작업이 필요하지 않도록 하기 위한 노력 대비 자동화 코드를 작성하는 데 드는 노력을 비교할 때 더욱 그런 어려움을 느낍니다. 그러나 일단 어떤 작업을 자동화 하면 누구라도 그 작업을 수행할 수 있다는 장점을 무시하기 힘듭니다. 그래서 누구든 적절하게 자동화를 활용할 수 있다면 시간의 절감 효과를 누릴 수 있습니다.

 

2. 신뢰성은 근본적인 기능이다.

비컴퓨터 분야에서의 자동화의 영향에 대한 논의들은 종종 고효율적 자동화의 단점에 대해 지적하곤 합니다. 시간이 흐르면서 자동화가 더 많은 부분들을 담당함에 따라 운영자들이 점차 긴장을 늦추게 된다는 것입니다. 그러면 여지없이 자동화 프로세스가 실패했을 때 운영자들이 시스템을 성공적으로 운영하지 못하게 됩니다.

 

운영자들이 제대로 대응하지 못하는 이유는 실전 경험의 부족과 더불어 그들이 생각하는 시스템의 동작이 실제 시스템의 동작과 일치하지 않기 때문입니다. 이런 상황은 시스템의 자율성이 비교적 떨어지는 경우에 더 자주 발생합니다. 즉, 자동화가 수동 작업을 대체하고, 수동 작업은 언제나 그랬듯이 항상 수행이 가능할 것이라는 것을 전제하는 상황에서 발생한다는 뜻입니다. 안타깝게도, 시간이 지남에 따라 이런 전제는 결국 문제를 야기하게 됩니다. 수동 작업에 필요한 기능이 더 이상 존재하지 않기 때문에 수동 작업 역시 더 이상 수행할 수 없게 되는 상황에 놓이게 됩니다. 신뢰성이란 근본적인 기능으로, 자율적이면서 탄력적으로 구현되었을 때 그 빛을 발합니다.

 

기타

구글은 자동화에 대한 강향 성향을 가지고 있다고 합니다. 그리고 대규모 서비스의 경우에는 자동화 수행에 대한 절충안에 대해 논의할 때 일관성, 신속성, 그리고 신뢰성에 대한 요소들이 주요 논쟁거리가 된다고 합니다.

 

자동화는 시간을 절약하는 것 이상의 가치를 제공하므로 단순히 자동화에 투입하는 시간과 그로 인해 절약되는 시간을 비교하는 것만으로는 판단하지 않았으면 합니다.

728x90

'CS > SRE' 카테고리의 다른 글

Ch09. 간결함  (0) 2023.08.02
Ch08. 릴리즈 엔지니어링  (0) 2023.08.02
[SRE] Ch06. 분산 시스템 모니터링  (0) 2023.07.26
[SRE] Ch05. 삽질은 이제 그만!  (0) 2023.07.19
[SRE] Ch04. 서비스 수준 목표  (0) 2023.07.18