Welches Monitoring System - Business

Es gibt 27 Antworten in diesem Thema, welches 6.718 mal aufgerufen wurde. Der letzte Beitrag () ist von Tuxtom007.

  • Hallo Zusammen,


    ich will gar nicht zu viel text hier schreiben.

    Ich suche Aktuell ein Monitoring für die Arbeit welches ich zuhause ggfs. bisschen testen kann.

    Was soll es können? Entsprechend alles Monitoren was ansteht, Switche, SNMP Geräte, Windows/LInux Server und ggfs. auch mit einer art "Discovery" Funktion kommen, also Server hinzufügen, scannen und schauen was so gefunden wird.

    Was ich bisher so durchprobiert habe

    Centreon - Ohne die Kostenpflichtige Subscription zuviel Manuelle arbeit

    Check_MK - Ansich recht ok, allerdings sucht man da ja ewig die funktion, find ich net sehr "selbsterklärend" bis ich da mal ein ping check gefunden hab :D.

    PRTG - Ansich easy to use, aber leider WIndows zwingend und frisst Extrem viel Ressourcen

    Nagios - Eig. glaube wie Centreon


    Was ich noch so auf dem Zettel habe was ich mir ggfs. anschauen will

    Zabbix

    Icinga


    Was würde ihr empfehlen? Umgebungstechnisch sind es um die 2.000 Hosts.

    Normal würde ich PRTG bevorzugen, aber die Ressourcen schrecken mich zu sehr ab wie die Umgebung dafür sized sein muss.

    Bei Zabbix bin ich einfach noch skeptisch ob es nicht einfach eine Centreon alternative ist, wobei dort meine ich die Templates Kostenlos sind.


    Gern eure Favourit Wahl, da ich es für die Arbeit suche ist es auch ok wenn Kostenpflichtig, bevorzugt dann aber auch wo ggfs. Dienstleistung mit einzukaufen geht, bringt ja nix wenn man was hat und muss dann in irgendwelche Community foren.

  • Also 2000 Hosts sind ja schon eine Hausenummer :winking_face:

    Also das ist Enterprise,alleine die Hardware worauf das läuft muss echt was können.

    Vigor 167 - OPNsense- 4x US-8-60W - US-8-150W- US-24-250W - 4 x UAP-AC-PRO- 4 x UAP-AC-M 6 x USW-Flex-Mini - Proxmox-Cluster -TrueNas- Fhem- Homematic und jede Menge anderen Blödsinn der eigentlich nur Strom frisst aber mir freude macht :smiling_face_with_sunglasses:

  • Das macht nix...die Leistung wäre da... es wäre jetzt auch kein Problem PRTG groß auszurollen im Cluster, allerdings krieg tman mit der Hardware die dafür benötigt wird auf anderer Software Basis die 3-4x Menge gemonitort :grinning_squinting_face:


    Ich such jetzt erstmal allgemein eine Software die in Frage kommen könnte, abgelöst wird dann wohl Centreon das z.t. die Umgebung mit 5 Servern überwacht.

    Man könnt sich jetzt überlegen alles zu lassen wie es ist und Centreon Subscriptions kaufen oder man überdenkt das ganze System.

  • Ich kenne nir checkMK was du bereits gesagt hast.

    Und bist du damit soweit zufrieden, oder anders gesagt was stört dich dran oder was ist gut?

    Ich hatte es kurz hier bei mir laufen, aber ich hab einfach net "gecheckt" wie genau der Agent funktioniert, klar er wurde "gebacken" und dann ausgerollt aber egal welche Addons ich Installiert habe, ich wusste nicht wie man dies überträgt.

    Und einem Host dem einfachen Ping zuzuordnen war ziemlich viel klickerei


    GErade probiere ich Zabbix, aber das ist ja noch unübersichtlicher

  • Also bei der Größe, hole ich mir Externe Berater.

    Das kannst du Zuhause nicht testen.

    Aber ist halt nur meine Meinung.

    Gruß

    speed

    Vigor 167 - OPNsense- 4x US-8-60W - US-8-150W- US-24-250W - 4 x UAP-AC-PRO- 4 x UAP-AC-M 6 x USW-Flex-Mini - Proxmox-Cluster -TrueNas- Fhem- Homematic und jede Menge anderen Blödsinn der eigentlich nur Strom frisst aber mir freude macht :smiling_face_with_sunglasses:

  • Hier geht es auch nicht drum zuhause zu testen was die Last angeht sondern Useability und steuerung :smiling_face: Die GUI und einrichtung wird sich nicht verändern nur weil ein Dienstleister das macht, die bauen höchstens Templates das man Server direkt einem Template zuordnet und sofort alles da ist, klar, aber ich will dennoch das Look and feel für mich erstmal sehen.

    Zabbix hab ich z.b. wieder weg geworfen, hab zwar jetzt gesehen wie man damit wohl arbeitet, aber die metriken direkt zu sehen ist hier zu umständlich.


    /edit

    Sobald ich dann auch weiß in welche Richtung es geht, wird man eh mit Dienstleistern reden und ein richtigen PoC machen, CheckMK ist da komplett noch nicht raus, es lies sich um einiges einfacher bedienen jetzt als Zabbix und nur weil ich noch net gerafft habe wie der Agent aktuallisert wird, muss es ja net schlecht sein.

    Aber ich kann jetzt auch nicht 10 PoCs starten daher will ich so 1-2 für mich finden die in die engere wahl kommen könnten.

  • Normal würde ich PRTG bevorzugen, aber die Ressourcen schrecken mich zu sehr ab wie die Umgebung dafür sized sein muss.

    Das verstehe ich jetzt nicht ganz. Wenn damit ca. 2.000 Hosts gemonitort werden sollen, dürfte der/die Eigentümer dieser Hosts doch sicher über auseichend liquide Mittel verfügen, die abschreckenden Ressourcen zu budegtieren. Oder hast du da ein, zwei Nullen zuviel angehängt - dann nimm die Community-Edition, damit kann man bis zu 100 Sensoren kostenlos überwachen :grinning_face_with_smiling_eyes:


    Ach, übrigens, wer monitort denn nachher das Monitoring? Bei den zigtausenden, täglich, stündlich oder sogar minütlich auflaufenden Statusmeldungen von 2.000 Hosts, braucht es ja eine ganze Kompanie von Admins, um dies zu bewerkstelligen - und das, wo Arbeitskräfte z.Z. ohnehin knapp sind :loudly_crying_face:


    Nach meiner unmaßgeblichen Meinung, monitort man die Dinge, welche lebensnotwendig, daher geschäftskritisch sind. Niemand wird es interessiern, wenn dem Host Nr. 1586 der Festplattenplatz langsam ausgeht oder Nr. 0815 immer leicht zu warm wird. Daher- überprüfe mal Deine Ansprüche.

  • Das verstehe ich jetzt nicht ganz. Wenn damit ca. 2.000 Hosts gemonitort werden sollen, dürfte der/die Eigentümer dieser Hosts doch sicher über auseichend liquide Mittel verfügen, die abschreckenden Ressourcen zu budegtieren. Oder hast du da ein, zwei Nullen zuviel angehängt - dann nimm die Community-Edition, damit kann man bis zu 100 Sensoren kostenlos überwachen :grinning_face_with_smiling_eyes:


    Ach, übrigens, wer monitort denn nachher das Monitoring? Bei den zigtausenden, täglich, stündlich oder sogar minütlich auflaufenden Statusmeldungen von 2.000 Hosts, braucht es ja eine ganze Kompanie von Admins, um dies zu bewerkstelligen - und das, wo Arbeitskräfte z.Z. ohnehin knapp sind :loudly_crying_face:


    Nach meiner unmaßgeblichen Meinung, monitort man die Dinge, welche lebensnotwendig, daher geschäftskritisch sind. Niemand wird es interessiern, wenn dem Host Nr. 1586 der Festplattenplatz langsam ausgeht oder Nr. 0815 immer leicht zu warm wird. Daher- überprüfe mal Deine Ansprüche.

    Doch genau das tut man :smiling_face: Man überprüft alle ~2.000 Server und deren Festplatte weil diese Applikationen, DAtenbanken usw. wo eben geprüft werden muss haben die FEstplatten noch genug Platz, laufen alle Dienste die benötigt werden, CPU/RAM last etc.


    Schau dir die Specs für PRTG an :smiling_face: es muss zwingend auf Windows laufen und ich würde dann so 15.000-20.000 Sensoren benötigen, wurde schon Preise eingeholt dafür ;).

    Allerdings brauchst du dann 2-3 Core Server die jeweils 10-12 CPU Kerne brauchen 16GB Ram (wobei das jetzt net viel is) und ~1-2TB an Speicherplatz.

    Also würde ich locker 30 CPU kerne benötigen, es ist möglich und nicht grundsätzlich ausgeschlossen, aber mit der benötigten Hardware kriege ich mit anderer Software eben mehr Hosts und Services hin, daher sondier ich einfach weiter :smiling_face: aber PRTG + CheckMK ist da in der bisherigen wahl.


    Wer die Meldung bearbeitet? Na je nach Abteilung der First, Second oder Third Level bereich.

  • Ich nutze gerne 'Advanced Host Monitor': KLICK


    Allerdings eine Windows Anwendung. Die Oberfläche wirkt etwas veraltet, ich persönlich finde es aber ansprechender als viele der "modernen" Web-Interfaces.


    Ach, übrigens, wer monitort denn nachher das Monitoring? Bei den zigtausenden, täglich, stündlich oder sogar minütlich auflaufenden Statusmeldungen von 2.000 Hosts, braucht es ja eine ganze Kompanie von Admins, um dies zu bewerkstelligen - und das, wo Arbeitskräfte z.Z. ohnehin knapp sind :loudly_crying_face:

    Ist dies nicht genau der Grund für eine Monitoring-Software?! Das System filtert z.B. nach OK, Warnung, Fehler, Kritisch und bereitet es grafisch auf. Somit lässt sich die Überwachung der Systeme mit deutlich weniger Personal bewerkstelligen, als alles von Hand im Blick zu behalten?!


    Nach meiner unmaßgeblichen Meinung, monitort man die Dinge, welche lebensnotwendig, daher geschäftskritisch sind. Niemand wird es interessiern, wenn dem Host Nr. 1586 der Festplattenplatz langsam ausgeht oder Nr. 0815 immer leicht zu warm wird. Daher- überprüfe mal Deine Ansprüche.

    Wenn beim File-Server oder dem Datenbank-Server die Festplatte voll läuft halte ich dies schon für kritisch, genauso wenn der Server plötzlich überhitzt.

    30 Sites - 500 APs - 150 Switche - EdgeRouter - UXG-Pro - UDM-Pro - USG-PRO-4 - OPNsense - IPUs

    Einmal editiert, zuletzt von usr-adm ()

  • Danke, ich dachte schon nur ich seh das gerade irgendwie verschoben bzgl. warum man was monitort und wozu es gut es, das ne vollgelaufene Festplatte egal wäre, ist schon ein Interessanter ansatz.


    Advanced Host Monitor ist ziemlich "veraltet" in der Übersicht :smiling_face: danke dafür, aber wird den Zweck nicht erfüllen da ich auch Linux Hosts überwachen muss, diverse Switche, Router und auch Firewalls von anderen Herstellern wo eben nur zum teil SNMP möglich ist.


    Check_MK macht da bisher im vergleich den besseren eindruck. PRTG hat hier den vorteil Agentless zu laufen, aber ggfs. stößt man da dann auch auf seine grenzen.

  • Man überprüft alle ~2.000 Server und deren Festplatte weil diese Applikationen, DAtenbanken usw. wo eben geprüft werden muss haben die FEstplatten noch genug Platz, laufen alle Dienste die benötigt werden, CPU/RAM last etc.

    Dann brauchst man ja mindestens 10.000 - 15.000 Sensoren, das hat ja dann schon fast NSA-Größenordnung - dass das Sinn ergibt, ist schwer vorstellbar, ebenso wie der Umstand, dass auf Arbeitsstationen Datenbanken laufen sollen. Aber egal, die Lizenz für 10.000 Sensoren startet jedenfalls z.Z. bei € 12.000,-- /a ohne Support (ab 18 tsd mit) und da fragts Du hier in einem Forum für -naja- angagierte Laien? Irgendwie nicht nachvollziebar.

    Also würde ich locker 30 CPU kerne benötigen,

    Also hier sind einmal die aktuellen Hardanforderungen für PRTG:



    Da liegst Du ja mit Deinen "locker 30 CPU kerne" fast um den Faktor 3 drüber. Und einen Server mit 2 St., z.B. 8 Core CPUs bekommt man schon zu einem Bruchteil der jährlichen Lizenzkosten für PRTG in der von Dir benannten Größenordnung, dies zumal sich erforderlicher RAM und Plattenplatz in Grenzen halten.


    Folglich stimmt hier irgend etwas nicht. 2.000 Hosts zu monitoren, ist mit den sich hieraus ergebenden Investitions-/Miet- und Personalkosten schon eine Aufgabe für größere, wenn nicht gar große Unternehmen. Die werden aber niemals jemanden losschicken, sich dies bzgl. ausgerechnet im Ubiquiti Netzwerk Forum schlau zu machen. Ich könnte ja nun fragen, wer bist Du wirklich, aber ich will es gar nicht wissen, ich steige lieber aus :smiling_face:

  • Nicht bös gemeint, aber hast du dich schon mal richtig mit Monitoring befasst? Klingt für mich nicht so, 10.000 sensoren sind doch nicht viel.

    Geh von einem Windows Server aus, was wirst du für Sensoren haben?

    CPU, Memory, Festplatten je nach VM 1-2, laufende Services, ICMP als solches, ggfs. noch ein TCP Port Scan.

    Da hast du schon mal 6-7 Sensoren für 1 Host X 100 Hosts, dann bist du bei 600-700 sensoren.

    Und da reden wir noch nicht von einem Switch der ggfs. 48 Ports hat, du jeden Port einzeln prüft bzgl der Auslastung dann bist du bei mindestens 50 Sensoren für einen Switch :smiling_face: wenn du davon 10 hast, bist auch bei 500 Sensoren, so läppert sich das.


    Problem mit PRTG ist, ich besitze eine Core XL Lizenz, die "up to 10.000" ist nur ein Richtwert, denn die Leistung die dafür gebraucht wird ist alles Hardware abhängig, man hat also mit der Core XL "Unlimited" Sensoren aber iwann macht die Hardware dicht, daher braucht man weitere Core Server und eine neue Lizenz.


    Und wieso sollten keine Datenbanken laufen? Wenn man ein SQL Cluster hat laufen auch einige SQL Datenbanken.

    Ich red hier auch von keinen Workstations oder PCs, sondern von Windows Servern und Linux Server.

    Das bei einem Windows 10 Client mal eine Festplatte voll läuft das wird wirklich nicht überwacht oder ob dieser heiß läuft.


    /edit nur als Hausnummer, das Aktuelle Monitoring besitzt ~21.000 Service Checks also gut 20.000 Sensoren und da fehlt noch so einiges was man eig. mit überwachen könnte um sauberes Troubleshooting zu betreiben wenn einer dieser Server ausfällt oder die Applikation darauf langsamm läuft und nur weil der Geldbeutel dafür vorhanden wäre ohne Probleme die Hardware dafür bereitzustellen, sollte man trotzdem sich die Frage stellen ob es Sinn macht, komm ich am Ende zu dem Entschluss dann klar. Daher frage ich einfach nach Erfahrungswerte der Leute hier wer mit was Monitort und ggfs. warum, vielleicht ist was dabei was ich noch nicht kenne oder keine beachtung schenkte

  • Ok, dann halt 2.000 Windows oder Linuxserver als Host :smiling_face: Domainhoster oder sowas?

    Nein :smiling_face: einfach in der IT bei einem größeren deutschen Unternehmen wo man eben für den Eigenbedarf diese Landschaft braucht, PC Workstations sind es +10.000.

    Und bei der Menge an Servern muss man eben Wissen mit einfach blicken ob bald eine FEstplatte voll läuft weil jemand wieder SQL Logs wieder auf debug geschaltet hat und nicht zurück usw. und genau dafür brauch man eben so was und dann eben auch gut händelbar um die sonderfälle abzufangen.


    Bzgl. Sonderfälle das ein gefühlt dafür bekommst, wenn du jetzt 10 verschiedene Server hast die verschiedene Applikationen als Windows Dienst laufen haben, dann willst du doch Monitoren ob dieser Dienst läuft, korrekt? :smiling_face: Denn wenn er nicht läuft geht die Anwendung nicht und da willst du doch sofort reagieren und nicht warten das der Geschäftsführer brüllt.

    Nun hast du aber das Problem das ggfs. die Server jemand anders verwaltet und dir der Admin des Servers nicht bescheid gibt das jetzt noch ein weiterer Service installiert wurde, wann bekommst du es mit? Wenn der Dienst nicht läuft und gebrüllt wird wieso er nicht gemonitort wird.

    Und so baut man ein Service Check der alle Dienste überprüft die auf "automatisch starten" stehen und nicht laufen, denn so stellt man sicher egal wer da was installiert als service, du hast ihn gleich abgefangen.

  • wenn du jetzt 10 verschiedene Server hast die verschiedene Applikationen als Windows Dienst laufen haben, dann willst du doch Monitoren ob dieser Dienst läuft, korrekt?

    Nun, ich habe nur 7 davon am laufen, aber ich meine, das geht mit dem Servermanager oder dem Windows Admin Center einfacher, besser und schneller. Aber wie sage ich immer: jedem Tierchen sein Pläsierchen :smiling_face:

  • Ich werfe mal noch Observium: Web-Portal zur Allround-Überwachung via SNMP - Installationsanleitung und Tipps in den Ring.


    Und dann werde ich so schnell es geht heraussuchen, wie viel (Sensoren o.ä.) wir dienstlich mit welcher hardware überwachen. Setzten bisher auch ausschließlich Check_MK ein. Haben auch viel einbauen lassen, damit „alles“ geht.

    „Meine“ dienstliche Infrastruktur werde ich schnell darstellen können. Alles, was nicht direkt in meinem Zugriff liegt wird etwas länger brauchen.


    Immer wieder ein spannendes Thema.

    Angenehme Nachtruhe. :sleeping_face:

  • Ok, dann halt 2.000 Windows oder Linuxserver als Host :smiling_face: Domainhoster oder sowas?

    Warum das den, die haben wir bei uns in der Firma alleine für Deutschland auch - und wir sind auch kein Hoster.



    In der Größenordnung bedarf es ein Enterprise-System da habe ich meine besten Erfahrungen bisher mit CheckMK gemacht, weil das eben alle Systeme per Agenten und/oder SNMP monitoren kann.

    Bei meinem Ex-Job hatten wir auch CheckMK und haben damit alle System überwacht, auch die bei Kunden vor Ort standen.


    Wenn man sowas aufbauen kann, ist es zwingend ratsam, 2 Leute mind. vorab mal auf Schulungen zu schicken, weil mit Learning-by-doing ist da schnell die Luft raus. Und wer 2000 System monitoren will, der sollte dafür auch das Geld investieren.

    Weil die Hauptarbeit kommt nämlich erst nach dem Einrichten der Clients im Monitoring, anpassen von Filterregel, automatisierte Aktionen, automatisiertes Erstellen von Tickets usw.usw.usw.


    Und noch ein großer Vorteil von CheckMK, der nicht zu vernachlässigen ist - es ist eine Deutsche Firma, mit deutschem Support und der Support von denen ist richtig gut.


    Nur so als Tip nebenher: Monitoring von System macht man nicht nebenher - bei uns in der Firma machen das 2 Kollegen Fulltime - und die sind noch nicht mal für die Netzwerk-Infrastruktur zuständig.

  • Warum das den, die haben wir bei uns in der Firma alleine für Deutschland auch - und wir sind auch kein Hoster ...


    .... Und wer 2000 System monitoren will, der sollte dafür auch das Geld investieren....


    .... Nur so als Tip nebenher: Monitoring von System macht man nicht nebenher - bei uns in der Firma machen das 2 Kollegen Fulltime - und die sind noch nicht mal für die Netzwerk-Infrastruktur zuständig.

    Das zweifle ich ja alles überhaupt nicht an, bzw. war das von Anfang an mein Reden.


    Nur nicht ganz geheuer ist mir, dass eine Person, welche vorgeblich die Bevollmächtigung hat (zumindest hat der TE sich so gegeben), für ein größeres Unternehmen die Entscheidung bzgl. eines derartigen Systems zu treffen, sich ausgerechnet hier beraten lassen will (nichts für ungut :smiling_face:) und das auch noch auf eine -na sagen wir mal- etwas holprige, alles andere als professionelle Weise:


    "Gern eure Favourit Wahl, da ich es für die Arbeit suche ist es auch ok wenn Kostenpflichtig, bevorzugt dann aber auch wo ggfs. Dienstleistung mit einzukaufen geht, bringt ja nix wenn man was hat und muss dann in irgendwelche Community foren"


    Und dies für ein System, welches seinem Arbeitgeber jährlich eine mittlere bis hohe fünstellige Zahl an Kosten verursachen wird