Mô tả công việc
Senior System Operation/ Infrastructure Engineer (Windows/Linux/VMware/Cloud)

Các trách nhiệm chính 1

1. Quản lý tính sẵn sàng hệ thống

•             Đảm bảo các dịch vụ hạ tầng máy chủ đáp ứng SLA về tính sẵn sàng, ổn định và liên tục.

•             Giám sát, vận hành, bảo trì và tối ưu hệ thống máy chủ.

•             Phân tích tác động thay đổi, xử lý sự cố và tham gia các hoạt động quản lý thay đổi (CAB).

•             Xây dựng và duy trì kế hoạch HA/DR, Business Continuity cho hệ thống.

2. Quản lý tài sản hạ tầng

•             Quản lý danh mục máy chủ, hệ điều hành, phần mềm, bản quyền và hợp đồng dịch vụ.

•             Duy trì hồ sơ cấu hình, tài liệu vận hành và thông tin tài sản CNTT.

•             Đảm bảo tính chính xác và cập nhật của dữ liệu hạ tầng.

3. Quản lý hiệu năng và năng lực hệ thống

•             Theo dõi, đánh giá và tối ưu hiệu năng hệ thống.

•             Lập kế hoạch năng lực (Capacity Planning) cho hạ tầng CNTT.

•             Đề xuất nâng cấp tài nguyên nhằm đáp ứng nhu cầu vận hành và tăng trưởng.

4. Quản lý thay đổi và chuẩn hóa hạ tầng

•             Đánh giá, triển khai và giám sát các thay đổi liên quan đến hạ tầng máy chủ.

•             Chuẩn hóa kiến trúc, cấu hình và quy trình vận hành hệ thống.

•             Cập nhật tài liệu, hướng dẫn vận hành theo các thay đổi thực tế.

5. Quản lý cấu hình và tiêu chuẩn kỹ thuật

•             Xây dựng, duy trì tiêu chuẩn hệ điều hành, nền tảng máy chủ và phần mềm hệ thống.

•             Quản lý cấu hình, sao lưu và khôi phục cấu hình hạ tầng.

•             Duy trì hệ thống quản lý cấu hình và kiểm soát phiên bản.

6. Giám sát vận hành và xử lý sự cố

•             Giám sát toàn bộ hạ tầng CNTT và các dịch vụ liên quan.

•             Chủ động phát hiện, xử lý sự cố và đảm bảo duy trì SLA.

•             Phối hợp với các đơn vị liên quan trong công tác vận hành và khắc phục sự cố.

7. Quản lý chất lượng dịch vụ

•             Theo dõi chất lượng vận hành dịch vụ CNTT.

•             Thực hiện phân tích nguyên nhân gốc (Root Cause Analysis) và đề xuất cải tiến.

•             Báo cáo xu hướng hiệu năng, rủi ro và các vấn đề ảnh hưởng đến dịch vụ.

Trình độ đào tạo

Đại học in Công nghệ thông tin or Khoa học máy tính

Giá trị cốt lõi

1. KHÁT VỌNG
2. CHÍNH TRỰC
3. HIỆU QUẢ
4. KỶ CƯƠNG
5. SÁNG TẠO

Kiến thức/ Chuyên môn cần có

•             Có kiến thức tốt và kinh nghiệm thực tế về Windows Server, Linux (RHEL, CentOS, Ubuntu), VMware và các dịch vụ liên quan trên các nền tảng này.

•             Có kiến thức tốt về nền tảng Cloud (AWS, FPT Cloud, CMC Cloud …) và các dịch vụ liên quan trên các nền tảng này.

•             Có kiến thức tốt về hạ tầng Data Center (DC) và Disaster Recovery (DR).

•             Có kiến thức tốt và kinh nghiệm thực tế với các hệ thống lưu trữ (SAN, NAS, Object storage).

•             Có kiến thức tốt và kinh nghiệm thực tế với giải pháp backup (Veeam).

•             Có kiến thức về nền tảng container (K8S, Openshift, EKS …).

•             Có kiến thức về nền tảng giám sát & ghi logs (Grafana, Prometheus, Telegraf, ELK …).

•             Có kiến thức cơ bản về mạng (TCP/IP, VLAN, routing, firewall …).

•             Kỹ năng lập trình cơ bản (Python, Bash, Shell).

Kỹ năng cần có

•             Kỹ năng giao tiếp, trình bày và viết tài liệu tốt.

•             Có khả năng giao tiếp và đọc hiểu tài liệu tiếng Anh.

•             Tinh thần học hỏi liên tục và sẵn sàng tiếp cận các công nghệ mới, công nghệ mã nguồn mở.

•             Có khả năng phối hợp hiệu quả với các nhóm hạ tầng, ứng dụng và an ninh.

•             Kinh nghiệm xử lý sự cố và phân tích nguyên nhân thực tế trong môi trường sản xuất.

•             Có kinh nghiệm sử dụng các công cụ tự động hóa (Ansible, Terraform).

Ưu tiên

•        Có chứng chỉ RHCSA/RHCE, VMware VCP-DCV, CKA/CKAD, AWS/Azure Cloud hoặc tương đương.

•        Có kinh nghiệm triển khai tự động hóa hạ tầng (Automation/IaC).

•        Có kinh nghiệm làm việc trong lĩnh vực Ngân hàng, Tài chính hoặc doanh nghiệp có hạ tầng CNTT quy mô lớn.