EJ KLASSIFICERAD

FSG-A // KLUSTER 6 — LISA 26 // 6.1

AI-DETEKTIONS-
PIPELINE

Författare: Tiny — TCCC CLS, FPV/UAV-certifierad

KOMPLETT LUFT 2026-04-13 12 MIN LÄSNING

SAMMANFATTNING

Drönarens kamera ser ett fordon. AI:n identifierar vad det är. Systemet beräknar var det befinner sig i den verkliga världen. En NATO-symbol visas på operatörens karta — allt inom 170 millisekunder. Denna pipeline transformerar råa kamerapixlar till handlingsbar underrättelse snabbare än en människa kan blinka.

Denna sida förklarar hur Lisa 26 omvandlar en rå kamerabild till ett bekräftat mål på en karta. Varje steg: från det ögonblick kameran fångar en bildruta till det ögonblick NATO-symbolen visas på den gemensamma operationsbilden (COP).

Hur AI:n ser — på vanlig svenska

Tänk på AI:n som en extremt snabb soldat som stirrar på en skärm. Den granskar varje enskild bildruta från kameran — 30 bilder per sekund — och letar efter saker den tränats att känna igen: stridsvagnar, pansarfordon, lastbilar, artilleri, truppformationer, drönare. När den hittar något ritar den en ruta runt det och säger "78% säker att det är ett pansarfordon." Allt detta tar 22 millisekunder — snabbare än du kan knäppa med fingrarna.

AI:n förstår inte vad en stridsvagn ÄR. Den känner igen mönster. Under träning visades den 50 000+ bilder av stridsvagnar från olika vinklar, avstånd och ljusförhållanden. Den lärde sig vilka pixelmönster som korrelerar med "stridsvagn." Nu jämför den nya kamerabilder mot dessa inlärda mönster. Styrkan: blixtsnabb, aldrig trött, ser i mörker med termisk kamera. Svagheten: en sinnrikt kamouflerard stridsvagn eller en stridsvagnformad attrapp kan lura den.

AI-modellen heter YOLOv8 (You Only Look Once, version 8). Den körs på en liten dator ombord på drönaren — Jetson Orin Nano (230 euro, 40×55 mm, 15W). Med TensorRT-optimering bearbetar den 640×480 pixlar i 22 ms. Utan optimering: 180 ms — för långsamt. TensorRT konverterar PyTorch-modellen till en Jetson-specifik binär som utnyttjar GPU:ns 1024 CUDA-kärnor parallellt.

Från pixel till karta — hur positionen beräknas

AI:n hittade ett fordon i kamerabilden vid pixelposition (420, 280). Men en pixel är inte en plats i den verkliga världen. Systemet måste omvandla "pixel 420, 280" till "MGRS PA 2345 6789." Denna transformation kräver tre saker: kamerans orientering (vart den pekar — från IMU:ns gyroskop och accelerometer), drönarens höjd (från barometern), och en terrängmodell (DEM) som berättar var markens yta befinner sig under pixeln.

I en GPS-nekad miljö (fienden stör all satellitnavigering) använder systemet tre alternativa positionskällor: barometrisk höjd (BMP390, ±0,5 m noggrannhet — berättar hur högt drönaren flyger), visuell odometri (ORB-SLAM3 spårar kamerafunktioner och estimerar rörelse — driftar 2–5% av flygd sträcka), och optiskt flöde (PMW3901 mäter markhastighet — fungerar under 30 m höjd). Ingen av dessa är lika noggrann som GPS men kombinerat ger de tillräcklig precision för ISR.

KAMERANS EGENSKAPER

Kameran (IMX477) har en känd lins — brännvidd 6 mm, sensorstorlek 6,3×4,7 mm. Detta betyder att systemet vet exakt vilken vinkel varje pixel motsvarar. Pixel (420, 280) = tittar 15° åt höger och 8° nedåt från centrum. Detta ändras aldrig.

DRÖNARENS ATTITYD

IMU:n (gyroskop + accelerometer) berättar för systemet drönarens exakta lutning — roll, pitch och yaw — 400 gånger per sekund. Detta fungerar UTAN GPS. Fienden kan inte störa ett gyroskop. Kombinerat med kameravinkeln: systemet vet exakt riktning i 3D-rymd som pixel (420, 280) pekar mot.

DRÖNARENS HÖJD

Barometern (BMP390, ±0,5 m noggrannhet) mäter lufttryck. Högre höjd = lägre tryck. Detta fungerar också utan GPS — ingen kan störa lufttryck. Systemet vet att drönaren är 120 m över startpunkten. Kombinerat med riktning: systemet spårar en stråle från kameran genom 3D-rymd tills den träffar marken 120 m nedanför. Den korsningspunkten = målets position.

Matematiken (för ingenjörer): pixel → kamerastråle [(u−cx)/fx, (v−cy)/fy, 1,0] → rotera med IMU-attityd till NED-ram → projicera strålen till DEM-markytan → konvertera NED-förskjutning till MGRS. Totalt: 3 matrismultiplikationer + 1 strålkorsning med DEM-gitter. Bearbetningstid: 2 ms på Jetson. Noggrannhet: ±15 m vid 120 m AGL med GPS, ±50 m utan GPS (domineras av positionsdrift).

Matematisk härledning — pixel-till-mark

Den fullständiga fyrstegs-härledningen av pixel-till-mark-projektionen är publicerad på den engelska versionen av denna sida. Matematiken följer Hartley & Zissermans Multiple View Geometry in Computer Vision (Cambridge University Press, 2004, kapitel 6) — sidans bidrag är det konkreta insättandet av Fischer 26:s sensorvärden och numeriska mellanresultat. De två bearbetade numeriska exemplen (120 m AGL vs 30 m AGL) och verifieringskoden är matematiskt verifierade i provable_claims.py under PIXEL_TO_GROUND_120M och PIXEL_TO_GROUND_30M.

Varför härledningen är operativt viktig

Tre separata operativa beslut beror på att denna matematik är korrekt. Målsökningsnoggrannhet: när Lisa 26 placerar en röd diamant på COP:en och befälhavaren auktoriserar en FPV-strike baserat på diamantens koordinater är koordinaterna bara så bra som denna härledning. Ett fel i rotationsordningen (kropp-till-värld är Rz·Ry·Rx, inte Rx·Ry·Rz) producerar symmetriska fel som placerar målet på fel sida av en trädgräns. Osäkerhetsbudget: känslighetsanalys visar att ett 1°-fel i IMU-pitch vid 120 m höjd producerar cirka 2 m markpositionsfel. Det är därför Fischer 26 är en BDA-plattform och inte en precisions-strike-plattform. GPS-förnekad navigering: härledningen visar explicit att projektionen behöver (1) pixelposition, (2) kamerakalibrering, (3) IMU-attityd, (4) barometrisk höjd — inget av detta kräver GPS.

Ett exempel: vid 120 m höjd och pitch = −3°, yaw = 45°, ger pixeln (320, 180) en markpositionsförskjutning på ungefär (7,4 m N, 7,4 m Ö) från drönarens nuvarande NED-position. Vid 30 m höjd med identiska övriga inparametrar blir förskjutningen exakt en fjärdedel: (1,85 m N, 1,85 m Ö). Den linjära skalningen med höjd bekräftar similar-triangles-argumentet och kopplar direkt till osäkerhetsbudgeten — pixelosäkerhet ×2 → positionsosäkerhet ×2.

NATO-symboler — markera mål på kartan

När systemet vet VAD det detekterade och VAR det befinner sig skapar det en NATO-standardsymbol (APP-6D) och placerar den på operatörens karta (COP). Röd diamant = fientligt, blå rektangel = eget, gul cirkel = okänt. Symbolens form anger typ: rektangel med diagonallinje = pansarfordon, triangel = artilleri, person = infanteri. Storleken anger konfidensen — större symbol = högre konfidens.

Formerna berättar vem det tillhör på ett ögonkast — du behöver inte läsa text. En operatör som tittar på en COP full av NATO-symboler kan bedöma hela stridsfältet på 5 sekunder. Utan symboler: operatören måste läsa varje detektion som text ("fordon, 78%, PA 2345 6789") — tar 10× längre och skalerar inte med detektionsvolymen.

NATO APP-6D SYMBOLFORMER

◇ Diamant

FIENTLIGT — fientliga styrkor. Röd färg. Om du ser en röd diamant på kartan är det en bekräftad eller misstänkt fiende.

□ Rektangel

EGET — våra styrkor. Blå färg. Egna förband och allierade.

○ Cirkel

OKÄNT — ännu inte klassificerat. Gul färg. Kan vara civilt, kan vara fiende. Behöver mer observation.

◇ Streckad diamant

MISSTÄNKT — troligen fientligt men inte bekräftat. Lågkonfidensdetektion.

Lisa 26 mappar automatiskt YOLOv8-detektioner till NATO-symboler. "armored_vehicle" med konfidens >70%: röd APP-6D pansarsymbol. "truck" med konfidens >60%: röd logistiksymbol. "person" med konfidens >50%: röd infanterisymbol. Konfidenströsklar är justerbara per uppdrag — under låg hotintensitet: höj trösklar för att reducera falsklarm. Under hög hotintensitet: sänk trösklar för att fånga fler potentiella mål.

Den kompletta pipelinen — från början till slut

KAMERAN FÅNGAR BILDRUTA

IMX477-kamera vid 30 FPS, 640×480 upplösning. Tid: 5 ms per bildruta.

AI DETEKTERAR OBJEKT

YOLOv8n på Jetson Orin Nano Super. Inferenstid: 33 ms. Utdata: klass (vad), bounding box (var i bilden), konfidens (hur säker).

POSITION BERÄKNAD

Pixel → kamerastråle → IMU-rotation → markkorsning vid barometrisk höjd. Tid: 50 ms. Utdata: relativ position från startpunkt. Ingen GPS behövs.

DETEKTIONSPAKET SKAPAT

JSON med: klass, konfidens, position, kurs, hastighetsestimat, källdrönarens ID, tidsstämpel. Kodas som MAVLink-följeslagarmeddelande.

SÄNDS TILL LISA 26

Via MANET 300 MHz (mil-band) till Fischer 26-relä → Starlink → Lisa 26-server. Eller via fiber till GCS. Tid: 100–300 ms beroende på länk.

FUSION + NATO-SYMBOL

Lisa 26 tar emot detektion, korsrefererar med andra drönare, tilldelar NATO APP-6D SIDC-kod, placerar symbol på COP-karta. Tid: 200 ms.

Detektionspipelinen transformerar råa kamerapixlar till NATO APP-6D-symboler på COP:en inom 170 millisekunder sensor-till-skärm. Varje steg bidrar: kamerainsamling 33 ms, YOLOv8-inferens 22 ms, geolokalisering 2 ms, APP-6D-symbolmappning 1 ms, MAVLink-paketisering 5 ms, MANET-transmission 7–50 ms, COP-rendering 10 ms. Totalen beror primärt på MANET-hopantalet — varje hopp adderar 7 ms.

Testa den interaktiva Dempster-Shafer-fusionskalkylatorn →

Öppna den interaktiva täckningskalkylatorn →

Öppna den interaktiva hotfusionsöversikten →

Öppna den interaktiva pipeline-analysatorn →

TOTAL TID: KAMERA TILL KARTA

Kameran ser 30 bilder per sekund. AI:n granskar varje bild på 22 millisekunder. Den hittar ett fordon. Systemet beräknar var det befinner sig: "MGRS PA 2345 6789." En röd pansarsymbol dyker upp på kartan. Allt inom 170 millisekunder — snabbare än du kan blinka. Operatören ser ett helt stridsfält fullt av symboler och fattar situationen på 5 sekunder. Det är 100× snabbare än att lyssna på radiorapporter. ~490 ms. Under en halv sekund från ögonblicket kameran ser ett mål till ögonblicket NATO-symbolen visas på befälhavarens karta. Det betyder att om ett fordon rör sig i 40 km/h har det bara flyttat 5 meter mellan detektion och visning.

Kostnad

DETEKTIONSPIPELINE-HÅRDVARA

Jetson Orin Nano Super

230 € — AI-inferens, 67 TOPS, 30 FPS YOLOv8

Arducam IMX477 + 6 mm

42 € — 12 MP kamera med karteringslins

128 GB microSD

15 € — modellvikter + offline-inspelning

250 GB NVMe SSD

30 € — Jetson-startenhet + inferenscache

Totalt per drönare

317 € — komplett AI-detektionskapacitet

Implementering

# Lisa 26 Detection Pipeline — YOLOv8 to MGRS
# pip install numpy
# pip install ultralytics
# pip install opencv-python
import ultralytics, numpy as np

model = ultralytics.YOLO("nordic_v3.engine")  # TensorRT optimized
cap = cv2.VideoCapture("/dev/video0")          # Arducam IMX477 CSI

while True:
    ret, frame = cap.read()
    results = model(frame, conf=0.5, imgsz=640)
    
    for det in results[0].boxes:
        cls = int(det.cls)          # 0=vehicle, 1=person, 2=drone
        conf = float(det.conf)     # 0.0-1.0
        x1, y1, x2, y2 = det.xyxy[0].cpu().numpy()
        
        # Pixel center → ground position (MGRS)
        cx, cy = (x1+x2)/2, (y1+y2)/2
        lat, lon = pixel_to_ground(cx, cy, drone_ahrs, cam_params)
        mgrs = lat_lon_to_mgrs(lat, lon)
        
        # Push to Lisa 26 COP via CoT
        cot_xml = build_cot(mgrs, cls, conf, timestamp=time.time())
        manet_socket.send(cot_xml.encode())  # Silvus MANET

Svensk leveranskedja

LEVERANSKEDJA & SÄKERHETSRISK

Jetson Orin Nano

⚠ RISK — Arrow Electronics (Kista), Mouser.se. NVIDIA designar (US), TSMC tillverkar (TW). Exportkontroll ITAR/EAR kan blockera

Arducam IMX477

✓ Electrokit.com, Amazon.se

NATIONELL SÄKERHETSRISK

Jetson Orin Nano: NVIDIA designar (US), TSMC tillverkar (TW). Exportkontroll ITAR/EAR kan blockera. Rekommendation: Försvarsmakten bör etablera strategiska reserver och utvärdera europeiska alternativ.

Interaktivt: latensanalysator för detektionspipeline

Lisa 26 — pipeline från kamera till COP

Varje steg i detektionspipelinen har uppmätt latens. Klicka KÖR för att se pipelinen köra i realtid. Justera reläantalet för att se hur MANET-avstånd påverkar total latens.

MANET-reläantal: 3

Källor

YOLOv8-arkitektur och prestandadata (docs.ultralytics.com, 2024). NVIDIA Jetson Orin Nano SDK-dokumentation. TensorRT-optimeringsvägledning. NATO APP-6D symbologistandard. STANAG 4609 KLV-metadataspecifikation. FSG-A detektionspipelineprestandamätningar vid Vidsel 2025.

ENKEL FÖRKLARING: HUR AI SER MÅL

Kameran på drönaren filmar video. En liten dator (Jetson) på drönaren granskar varje bildruta och känner automatiskt igen vad den ser — är det en stridsvagn? En lastbil? En person? Detta kallas YOLOv8 (You Only Look Once, version 8). Den bearbetar 30 bildrutor per sekund och ritar en ruta runt allt den känner igen. Varje detektion kommer med en konfidensnivå: 87% betyder att AI:n är ganska säker, 50% betyder att den gissar. Operatören bekräftar eller avvisar varje detektion innan den hamnar på kartan.

ENKEL FÖRKLARING: NATO-KARTSYMBOLER

NATO använder en standarduppsättning symboler för att markera saker på kartor, definierad i APP-6D. Varje militär i alliansen använder samma symboler. En röd diamant betyder fientligt. En blå rektangel betyder eget. En gul cirkel betyder okänt. Inuti formen anger mindre symboler vad det är — en stridsvagn, infanteri, artilleri, en helikopter. Lisa 26 tilldelar automatiskt korrekt NATO-symbol när AI:n detekterar något. En detekterad stridsvagn blir en röd diamant med en pansarikon. Denna symbol visas på varje operatörs karta så alla ser samma bild.

Relaterade kapitel

Systemarkitektur: online/offline

Hotfusion

Beslutsmotor: L1/L2/L3

AI-träning: nordiska modeller

AI-DETEKTIONS-PIPELINE

Hur AI:n ser — på vanlig svenska

Från pixel till karta — hur positionen beräknas

Matematisk härledning — pixel-till-mark

Varför härledningen är operativt viktig

NATO-symboler — markera mål på kartan

NATO APP-6D SYMBOLFORMER

Den kompletta pipelinen — från början till slut

Kostnad

DETEKTIONSPIPELINE-HÅRDVARA

Implementering

Svensk leveranskedja

LEVERANSKEDJA & SÄKERHETSRISK

Interaktivt: latensanalysator för detektionspipeline

Källor

Relaterade kapitel

AI-DETEKTIONS-
PIPELINE