系统管理员
从事计算机网络运行、维护的人员
系统管理员指从事计算机网络运行、维护的人员。主要分为网络系统管理员和信息系统管理员。
基本介绍
系统管理员
网络系统管理员主要负责整个网络的网络设备和服务器系统的设计、安装、配置、管理和维护工作,为内部网的安全运行做技术保障。服务器是网络应用系统的核心,由系统管理员专门负责管理;信息系统管理员则负责具体信息系统日常管理和维护,具有信息系统的最高管理权限。
主要职责
(1)确保网络通信传输畅通
(2)掌握主干设备的配置情况及配置参数变更情况,备份各个设备的配置文件
(3)对运行关键业务网络的主干设备配备相应的备份设备,并配置为热后备设备
(4)负责网络布线配线架的管理,确保配线的合理有序
(5)掌握用户端设备接入网络的情况,以便发现问题时可迅速定位
(6)采取技术措施,对网络内经常出现的用户需要变更位置和部门的情况进行管理
(7)掌握与外部网络的连接配置,监督网络通信状况,发现问题后与有关机构及时联系
(8)实时监控整个局域网的运转和网络通信流量情况
(9)制定、发布网络基础设施使用管理办法并监督执行情况
操作系统管理
(1)在网络操作系统配置完成并投入正常运行后,为了确保网络操作系统工作正常,网络管理员首先应该能够熟练的利用系统提供的各种管理工具软件,实时监督系统的运转情况,及时发现故障征兆并进行处理。
(2)在网络运行过程中,网络管理员应随时掌握网络系统配置情况及配置参数变更情况,对配置参数进行备份。网络管理员还应该做到随着系统环境的变化、业务发展需要和用户需求,动态调整系统配置参数,优化系统性能。
(3)网络管理员应为关键的网络操作系统服务器建立热备份系统,做好防灾准备。
(1) 确保各种网络应用服务运行的不间断性和工作性能的良好性,出现故障时应将故障造成的损失和影响控制在最小范围内。(2) 对于要求不可中断的关键型网络应用系统,除了在软件手段上要掌握、备份系统参数和定期备份系统业务数据外,必要时在硬件手段上还要建立和配置系统的热备份。
(3) 对于用户访问频率高、系统负荷的网络应用服务,必要时网络管理员还应该采取分担的技术措施。
用户服务与管理
(1) 用户的开户与撤销;
(2) 用户组的设置与管理;
(3) 用户可用服务与资源的的权限管理和配额管理
(4) 用户计费管理
(5) 包括用户桌面联网计算机的技术支持服务和用户技术培训服务的用户端支持服务。
安全保密管理
(1) 安全与保密是一个问题的两个方面,安全主要指防止外部对网络的攻击和入侵,保密主要指防止网络内部信息的泄漏。
(2) 对于普通级别的网络,网络管理员的任务主要是配置管理好系统防火墙。为了能够及时发现和阻止网络黑客的攻击,可以加配入侵检测系统对关键服务提供安全保护
(3) 对于安全保密级别要求高的网络,网络管理员除了应该采取上述措施外,还应该配备网络安全漏洞扫描系统,并对关键的网络服务器采取容灾的技术手段。
(4) 更严格的涉密计算机网络,还要求在物理上与外部公共计算机网络绝对隔离,对安置涉密网络计算机和网络主干设备的房间要采取安全措施,管理和控制人员的进出,对涉密网络用户的工作情况要进行全面的管理和监控。
信息存储备份管理
(1) 采取一切可能的技术手段和管理措施,保护网络中的信息安全
(2) 对于实时工作级别要求不高的系统和数据,最低限度网络管理员也应该进行定期手工操作备份。
(3) 对于关键业务服务系统实时性要求高的数据和信息,网络管理员应该建立存储备份系统,进行集中式的备份管理。
(4) 最后将备份数据随时保存在安全地点更是非常重要。
机房管理
(1) 掌握机房数据通信电缆布线情况,在增减设备时确保布线合理,管理维护方便;
(2) 掌管机房设备供电线路安排,在增减设备时注意负载的合理配置;
(3) 管理网络机房的温度、湿度和通风状况,提供适合的工作环境;
(4) 确保网络机房内各种设备的正常运转;
(5) 确保网络机房符合防火安全要求,火警监测系统工作正常,灭火措施有效;
(6) 采取措施,在外部供电意外中断和恢复时,实现在无人值守情况下保证网络设备安全运行;
(7) 保持机房整洁有序,按时记录网络机房运行日志,制定网络机房管理制度并监督执行。
其它管理
(1) 配合其它部门进行部门局域网络的建设,提出规划、标准。
(2) 配合保卫部门,对网络不良行为进行取证。
(3) 做到网络中心服务反馈工作,及时通报网络运行信息。
基本要点
负责流程与制度的完善
(1)根据规范、流程及产品说明等具体进行网络与系统服务器的日常维护、配制、安装等;
(2)在实践中及时反馈发现的问题并协助解决,并根据实践为流程与制度的完善提供意见;
负责系统的优化
根据对网络和系统在性能容量、可靠性、安全性等方面的分析,为系统优化提供建议,并执行系统的优化工作,提高网络与系统的效率;
负责系统的日常维护
(1)维护公司网络系统、电话系统的安全,保障网络可靠的运行;
(2)协助上级维护公司数据库,保证公司各服务器设备的正常运行;
(3)维护保养计算机、网络硬件设备、系统软件、应用软件等相关IT设施;
(4)诊断并排除设备及软件故障
编制、整理系统文档,记录IT设备及其使用状况,实现系统文档管理的规范化;
(1)及时为公司各部门计算机及网络正常运作提供技术支持,提高办公效率;
(2)协助上级编制计算机基础知识、常用软件和其它管理软件的使用教材,协助上级开展培训,为最终用户提供IT技术支持。
职业定位
首先,计算机网络管理员是一个“先存在而后有定义”的职业
计算机网络管理员(简称网管员)是一个蓬勃发展的新兴职业,在短短的几年内,已成为绝大多数企业中必设的工作岗位,也成为众多年轻人向往的职业。而网管员同时也是一个“先存在而后进行定义”的职业,网管员职业标准的滞后以及传统教育的缺失,使得社会普遍对这个职业存在着很多疑惑,不管是求职者,还是用人单位都存在着如下的疑问:什么是合格的计算机网络管理员?一个计算机网络管理员需要从事什么样的具体工作?作为网络管理员必备的技能是什么?如何培养合格的计算机网络管理员?而对“网管员”从业人员来讲,如何获得相关知识和技能呢?
其次,网管员要建立终身学习的理念
终身学习是对传统教育的观念、体系、结构、组织的终结者。其价值理念源自当代社会知识爆炸和信息急剧增长的现状,已成为现代一种新的生活方式。传统知识教育中并没有针对网管员职业设置的专业,另外,注重理论的讲授无法满足强调动手能力的工作要求。从业人员只能通过在工作中不断地学习和探索来满足岗位的需求;而另一方面,IT技术无疑是这个时代发展最为迅猛的技术之一,其普及与应用的速度也是无与伦比。这就要求“网管员”必须建立终身学习的理念,通过参加培训、自学、交流等种种渠道学习和掌握最新、最实用的技术,构建和完善自身的技术体系
最后,什么是合格的计算机网络管理员?一个计算机网络管理员需要掌握哪些技能呢?
依据企业的业务性质与规模不同,对网管员的工作要求也有较大的差异。IT信息系统规模大的企业,分工较细,网管员可能只需要负责计算机机房的网络运行和维护;而一些小型企业,只设一个网管员,他(她)可能不但要负责IT系统运行维护中的设备管理,还要负责网络管理和系统管理,还有的企业需要网管员进行一些简单的网站建设和网页制作等工作。
总之,对网管员的要求基本就是大而全,不需要精通,但什么都得懂一些。所以,总结下来,一个合格的网络管理员最好在网络操作系统网络数据库、网络设备、网络管理、网络安全、应用开发等六个方面具备扎实的理论知识和应用技能,才能在工作中做到得心应手,游刃有余。
必备技能
无论是UNIX还是NT,对于用户的管理都是居于第一位的,作为一个新手,首先必须立刻掌握对用户的增加和删除以及限制等操作。这包括两个方面:
一个是学会使用友好的图形界面的管理工具集,在SUN Solaris系统中是Openwin环境下的/usr/bin/admintools工具集;在SCO UNIX中使用Sysadmsh管理Shell来管理用户;在Novell系统中,则只需使用Syscon菜单即可完成用户及用户组的添加、删除以及限制设置等等,多用户的同批管理,则使用makeusr和userdef实用程序来做;在NT中,则使用程序组中管理工具(公用)组下的域用户管理工具或用户管理工具。使用这些工具,就可以十分简单明了地进行用户的创建、删除以及锁定和权限限制等操作。在NT下用户组的管理和控制面板中的系统属性程序管理用户环境设置简要文件,使用System Policy Editor配置一个域范围的基于计算机或用户的配置以及编写登录脚本
二是学会字符命令行下的用户管理,主要在UNIX或Linux环境下,包括用编辑工具Viemacs等对/etc/passwd进行操作或直接使用addusr、deleusr等用户管理命令以及使用pwconv命令使/etc/passwd与shadow文件保持一致,使用SCO的/etc/rmuser命令删除用户,用newgrp命令将用户添加到新组,另外包括用户目录的建立命令mkdir,赋于用户属性和组属性命令chownchgrp,以及用户区域限制命令quota限制用户区域大小,用来避免用户区域占用硬盘
空间过大,而使系统崩溃。其中,特别提醒一点,如果想对用户权限进行严格限制时,用户的注册shell可使用/usr/lib/rsh。用户的.profile和.login文件可使用系统标准的配置文件,或者也可在.profile中进行相应设置,用SU命令或SU Username进入用户环境以进行具体检测。另外,对用户的消息发布系统,在NT中是使用Alert功能发出,对远程主机则使用Server Manager中的computer|send message功能。在Novell中采用send命令。在UNIX中是使用wall或write指令,也可使用每日消息文件/etc/motd或news命令发出/usr/new文件内容。
安全及日志管理
作为一个系统管理员,必须要能对系统事故找到故障原因,这就涉及到必须对系统的各项日志进行察看分析。在NT中是使用Administrative Tools菜单中Event Viewer查看系统的SYSTEM、SECURITY、APPLICATION日志文件。对Netware而言,错误日志是SYS.ERR文件,通过syscon菜单中supervisor options下view file server errorlog观察记录,另外文卷错误日志文件是各文卷中的VOL.LOG以及事务跟踪处理系统错误日志文件SYS:文卷中的TTS.ERR文件;UNIX中各项日志包括/usr/adm目录下的系统错误登记文件message、使用su命令的记录文件sulog、每个用户记录上次注册时间的登记文件lastlog、系统中注册用户的有关信息文件wtmp、每个用户所执行命令的内容项文件acct以及/etc目录下当前注册用户的有关信息文件utmp和其他应用程序产生的日志文件。对于其中的一些日志文件,可以采用who或w命令查看当前系统的登录使用者(XENIX系统中还可以用whodo命令确定当前用户的行为);last命令查看以前的登录情况,这些命令都可以合并使用grep进行条件控制选择过滤;用find查看文件及其属主,特别监控具有根访问权的进程及文件以及检查开机文件/etc/inetd.conf、/etc/rc.local、/etc/passwd和corn或at运行的文件,并用corntab -l 与corntab -r命令对用户的corntab文件进行列出与删除管理;使用ls -lR生成主检查表,并定期生成新表,使用diff命令进行比较,并使检查通过的新表成为新的主检查表,直到下一次检查为止。个人强烈建议在inetd.conf中注释掉所有的r打头的命令文件,以及去掉/etc/hosts.equiv中的所有项并不允许用户设立个人的.rhosts文件,使可信主机不予设立或为空以加强系统的安全。
在UNIX中,系统报告命令包括df用来报告自由磁盘块数;du用来总结磁盘使用状况;nice用来改变某个命令所设优先权;Pstat用来报告系统信息,如节点表或进程表;sar用来报告系统的活动状态如CPU的使用和缓冲区的活动状况;time用来打印过去的时间、系统时间以及命令的执行时间;uptime用来报告系统的活动状况,如系统启动时间及已运行时间;vmsfat用来报告页数及系统统计数字,如分支点的情况。BSD UNIX中的ps -aux或system V中的ps -ef以及LINUX中的ps aux用来查看进程状态及其宿主,并使用kill命令及时停止不正常的进程。在NT中则使用Task Manager查看cpu和内存的使用情况,进行进程管理,另外也使用performance monitor进行状态监控,以及时做出调节。值得注意的是,随着网络应用的扩大,病毒成为对网络安全的一大威协。为此,在网络上安装病毒检测和清除工具已经成为网络管理必须要做的。
备份管理
作为一个较重要的系统,及时备份是必需的,那么在一开始就必须养成及时定时备份的习惯。掌握备份的基本方法和步骤,以及使用基本的备份还原命令,如:NT中使用管理工具集中的NTBackup程序。因在Backup中不存在调度能力,备份必须手工完成或用AT命令行实现调度;以及采用第三方的备份解决方案。UNIX中系统V使用tar、cpio以及backup、restor、rolcopy,BSD中则使用tar、dump、restor等等,SCO中使用sysadmin进行文件系统后备和恢复文件。备份还必须制定计划,指定何时进行何种备份,包括全集备份和递增备份,如可以每周做一次全集备份,每天进行一次递增备份,或者如系统不经常变化,则可每月一次全集备份,每周一次递增备份。恢复与容错管理 当系统出现故障时,作为系统管理员必须能定位并解决问题,这依赖于对控制台出错信息以及日志文件的分析,更重要的是平日的备份以及应急系统盘的制备。对于NT而言,是建立系统引导盘、紧急修复盘等,并使用Disk Adminstrator建立镜像等RAID操作。对于UNIX而言,也依赖于系统安装盘与紧急修复盘的建立。特别地,系统做任何改动后,都要重新生成新的系统恢复盘,并进行同步备份和使用单用户模式来排除系统的绝大部分问题,即启动时使用boot -single命令,这是一个关键。当然,管理员的口令是绝对不能忘记的,否则,那会造成很大麻烦,但对于管理人员而言,自己以及其它用户都加上口令的使用限制,如口令字长度和日期限制以及其它限制,是非常必要的。太过简单的口令往往会造成不安全的隐患。在容错上则还包括经常地运行各类维护系统命令,如超级块维护命令SYNC,文件系统检查命令fsck。
文件系统与开关机管理
在所有的多用户系统中,由于广泛采用文件缓冲,使对文件的修改在内存进行之后再写入磁盘,内核程序定时刷新这些缓冲区,以保持文件与缓冲区间同步。因而,不终止系统就关机,往往会造成同步的破坏,而出现文件系统的错误。在NT中,使用启动菜单中的关闭系统选项来关闭系统;UNIX则采用shutdown、halt(haltsys)、reboot等命令。一般推荐使用shutdown加参数来关机或进入单用户备份状态,直到完成关机程序后,才能关闭电源,无论如何,这是必须牢记的。
另外,在维护文件系统时,应经常运行超级块一致命令sync,文件系统检查及错误修改命令fsck,新建一个文件系统时使用mkfs命令,系统V的fsstat将报告文件系统的状态,以及设备管理命令mount、umount。 NOVELL中采用FILER菜单管理文件服务器的文件系统。
网络管理
网络管理,包括对E-mail、DNS以及WWW的调试。对于E-mail而言,是使用sendmail -bt -C filename进行,或先mail user,再telnet host 110,通过user username;pass passwd;list;retr *;quit等pop3命令进行调试。对于DNS,则使用nslookup命令进行域名解析,看能否正确解析出IP地址。对于WWW,则是通过浏览器进行检查。另外是察看~/httpd/下的浏览日志,对于NT而言,则通过管理工具下的server manager察看各服务程序是否正常运行,其余检测步骤则与UNIX系统相同,只是不使用sendmail命令,而采用telnet host 25,用helo host,send from:< yourname@hostname >, rcpt to:< username@hostname >,data,messagebody,“.”,exit等smtp命令进行检测,POP3命令都相同。WWW的管理则直接通过http形式的在线管理方式进行,操作简易明了,应该不会有什么问题。 另外,在网络日常管理中,则包括使用ping察看网络连接状态,netstat察看协议统计数据和当前网络的连接状态,ifconfig进行网络接口设置,tracert进行路由状态监察。对NT系统而言,除以上命令外,还包括使用/winnt/system32/Regedit32来控制注册表,以及IPconfig察看IP设置,以及用与NT server配套的Network monitor进行网络负载和性能统计。Novell系统中则使用NETADMIN实用程序或图形界面的管理工具Netware Adminstrator来管理和规划网络,以及用monitor菜单监控本地服务器的各项状态。相对于UNIX的第三方工具集,能够作为管理者运行的网络管理软件主要有HP的OpenView、BAY的optivity、IBM的Netview和SUN的SunNetManager。
管理员面试
你的技术背景怎样?
鉴于系统管理员角色的不同范围,专业教育的要求也各不相同。大多数系统管理员工作需要在计算机科学领域有坚实的基础,如工程学士学位。一些组织要求拥有入门级认证,如CompTIA Server+或者类似的特定技术认证,如微软认证专家(Microsoft Certified Professional)或VMware Certified Associate - Data Center Virtualization(VCA-DCV)。
虽然这个答案的预期结果有很大的灵活性,但了解你的差距,然后准备对此进行讨论。如果你没拥有任何具体的认证,你是否有相关或类似的经验?例如,如果职位要求拥有VMware Certified Professional 5 - Data Center Virtualization认证,而你拥有VCA-DCV,可以讨论你的专业知识与相关应用类似技术技能的项目。
面试前,确认你的所有证书都在有效期内,并且和认证服务商确认数据库中你的资料是否正确。潜在雇主可能查询这些信息在微软、VMware或CompTIA以及其他组织的有效性。过期的、老旧的或者互相矛盾的信息都会让你吃大亏。
应对这个面试问题还可以展示你对企业价值与能力的评估方式。在描述教育经历和认证时,强调每个证书是如何帮助你的;展示每个教育投资的战略意义。
你的操作系统与服务的使用背景与经验如何?
系统管理员需要保证服务器与终端节点的配置、优化与云顶运行,所以面试会不可避免的转向服务器硬件、操作系统,如微软Windows Server 2012 R2,Vmware Vsphere虚拟化管理程序,以及网络服务的规模与应用,如活动目录域名系统动态主机配置协议虚拟专用网等。
雇主希望能了解你的领域范围以及是否与他们的IT基础设施核心技术匹配。典型的回应方式是:谈谈你负责的任务以及任何特殊项目,如测试安装操作系统补丁,或者管理服务器升级到Windows Server 2012 R2。不用担心你的经验是否能匹配每项要求,因为辅助技能可以加强工作能力。
如何处理用户与终端系统支持
系统管理员的角色通常都超出数据中心并延伸到最终用户以及他们的设备。
在面试中回应这样的问题是一个契机,可以突出你熟悉帮助台工单系统以及远程桌面管理,尤其是在具有很多雇员的大企业中。
限定讨论框架是一个有效的方案。他们已经知道你可以给Windows打补丁、升级或者安装内存等。证明你了解用户支持与清晰沟通的商业价值,能够使用工具来解决问题并快速恢复功能。说明使用的具体工具,并强调它们能带来的收益。
突出你在其他数据中心设备管理的经验与能力,比如控制最终用户访问,防火墙、路由器与交换机的管理背景。阐述自己对一些系统管理工具,如Splunk与Nagios的专业知识。
如何管理系统性能
系统管理员要定期监控系统的可用性与性能。雇主一般会要求在面试系统管理员时回答两个问题,以了解他们对硬件运行的预期以及可接受的资源利用率水平评估,如备份计划任务,注意错误以及检查重点事件日志的能力等等。
数据中心决策需要坚实的指标。专注于能够服务于你当前角色的关键绩效指标(KPI)。这些指标范围可以从CPU、内存与磁盘利用率这类主机级别到服务器虚拟机工作负载数量颗粒度。
注意每个KPI对业务都是十分重要的。也许你正在观察每台主机的虚拟机数量或服务器起源,因为你正试图通过回收未充分利用的资源以提高虚拟机整合度。如果你不知道自己所关注的每个KPI代表什么,那可能是一个危险的信号。
在谈话中可以援引注入SolarWinds、ManageEngine或Nagios等具体的监控与管理工具。向你的潜在雇主介绍这些内容——表明你可以很轻松的从一个工具过渡到另一个。
如何在当前角色的情况下处理备份与恢复作业
系统管理员将物理与虚拟备份存储到各种媒体、存储层或归档子系统中。
熟悉特定的备份工具并理解健全的备份与恢复实践十分重要,所以聊聊你所采用的工具,如CommVault Enterprise Backup Software或 Symantec NetBackup。恢复往往是任何数据保护策略中最弱的一环,所以要强调验证或测试备份的方法,以保证可恢复性。例如通过复制把虚拟机还原到测试服务器上,以验证备份的完整性
备份与恢复同样影响数据保留、法律发现和相关的数据安全问题,如 数据窃取与法规遵从。抢手的系统管理员了解能够解决这些重要业务问题的备份方式。例如,如果你的简历背景包括数据管理,那么在面试时可以讨论归档或销毁数据的方法。
每个系统管理员都必须了解的领域
你曾经解决过的最棘手问题是什么?
这是面试中最能推动候选人的一个问题。系统管理员是专业的疑难解决专家,能够识别和解决在硬件、软件、网络、服务和应用上的问题。
有些系统管理员面试还包括一个简单故障排除测试场景。突出最近的经验来强调你的诊断过程与专业知识。在短短的一个例子中,你可以阐述如何确定问题,利用系统日志来缩小问题范围,并使用PerfMon等查用工具来试验性能,用PowerShell来查询或更改配置数据,以及这一系列步骤最后得出的解决方案。
为潜在雇主展示,你能够运用理性并充分利用诊断工具来解决问题,并且快速恢复功能。着重突出在处理过程中可以保障应用与服务可用,如从故障服务器上迁移工作负载。
如何管理虚拟化服务器这个过程
不要被这种类型的面试所迷惑。虚拟化无疑是一个重要技术,系统管理员应当具备虚拟机管理程序的详细知识,所以着重突出你使用管理程序或混合管理,以及远程管理(物理服务器与虚拟机)的经验。
但不要只局限于此。
这个问题讲究的是策略,而不仅仅是技术的讨论。作为一个领导角色,你要如何权衡、组织与执行这项新兴技术在数据中心的部署?IT能提供怎样具有成本效益的服务,提升企业的竞争力。
这是一个站出来成为经理的好机会。谈论如何评估虚拟机管理程序,如何确定哪些工作负载需要虚拟化、进行性能测试并保障决策过程,以及如何从虚拟化技术中最大化用户与商业利益。
最新修订时间:2024-10-27 13:28
目录
概述
基本介绍
主要职责
参考资料