22.01.05 | Notion

Untitled

#! /usr/bin/env python3

import rospy
import os
from std_msgs.msg import Float32MultiArray
from vision_msgs.msg import Detection2D
from vision_msgs.msg import Detection2DArray
from vision_msgs.msg import BoundingBox2D
from vision_msgs.msg import ObjectHypothesisWithPose

rospy.init_node('test_subscriber', anonymous=False)

def callback1(msg1): # bounding box
    try:
        print("Bbox x: ", msg1.detections[int(PPP)].bbox.center.x)
        print("Bbox y: ", msg1.detections[int(PPP)].bbox.center.y)
    except:
        print('No Person Detected')
    
def callback2(msg2): # confidence
    try:
        if len(msg2.data)!=0:
            print("confs: ", msg2.data[int(PPP)])
    except:
        print('No Person Detected')

def callback3(msg3): # class id
    global PPP # for only person
    PPP = 'fuck' # for only person
    
    if len(msg3.data)!=0:
        for i in range(len(msg3.data)):
            if msg3.data[i]==0: # person class is number 0
                PPP = i
                print("clss: ", msg3.data[i])
    #os.system('cls' if os.name =='nt' else 'clear')
    

def listener():
    rospy.Subscriber('/clss', Float32MultiArray, callback3) # class id , detecting only person
    rospy.Subscriber('/confs', Float32MultiArray, callback2) # confidence
    rospy.Subscriber('/bbox', Detection2DArray, callback1) # bouding box center x,y
    
if __name__ == '__main__':
    listener()
    rospy.spin()

trt_y>olo.py

#! /usr/bin/env python3
"""trt_yolo.py

This script demonstrates how to do real-time object detection with
TensorRT optimized YOLO engine.
"""

import os
import time
import argparse

import cv2
import pycuda.autoinit  # This is needed for initializing CUDA driver

from utils.yolo_classes import get_cls_dict
from utils.camera import add_camera_args, Camera
from utils.display import open_window, set_display, show_fps
from utils.visualization import BBoxVisualization
from utils.yolo_with_plugins import TrtYOLO
import rospy
from std_msgs.msg import Float32MultiArray # for sending msg class, confidence inform 
from vision_msgs.msg import Detection2D # for sending bouding box
from vision_msgs.msg import Detection2DArray # for sending bounding box
from vision_msgs.msg import BoundingBox2D # for sending bounding box
from vision_msgs.msg import ObjectHypothesisWithPose # for sending bounding box
WINDOW_NAME = 'TrtYOLODemo'

def parse_args():
    """Parse input arguments."""
    desc = ('Capture and display live camera video, while doing '
            'real-time object detection with TensorRT optimized '
            'YOLO model on Jetson')
    parser = argparse.ArgumentParser(description=desc)
    parser = add_camera_args(parser)
    parser.add_argument(
        '-c', '--category_num', type=int, default=80,
        help='number of object categories [80]')
    parser.add_argument(
        '-m', '--model', type=str, required=True,
        help=('[yolov3-tiny|yolov3|yolov3-spp|yolov4-tiny|yolov4|'
              'yolov4-csp|yolov4x-mish]-[{dimension}], where '
              '{dimension} could be either a single number (e.g. '
              '288, 416, 608) or 2 numbers, WxH (e.g. 416x256)'))
    parser.add_argument(
        '-l', '--letter_box', action='store_true',
        help='inference with letterboxed image [False]')
    args = parser.parse_args()
    return args

def loop_and_detect(pub, pub2, cam, trt_yolo, conf_th, vis):
    """Continuously capture images from camera and do object detection.

    # Arguments
      cam: the camera instance (video source).
      trt_yolo: the TRT YOLO object detector instance.
      conf_th: confidence/score threshold for object detection.
      vis: for visualization.
    """
    #r = rospy.Rate(10) #to downgrade FPS
    full_scrn = False
    fps = 0.0
    tic = time.time()
    while True:
        if cv2.getWindowProperty(WINDOW_NAME, 0) < 0:
            break
        img = cam.read()
        if img is None:
            break
        boxes, confs, clss = trt_yolo.detect(img, conf_th)
        img = vis.draw_bboxes(img, boxes, confs, clss)
        img = show_fps(img, fps)
        cv2.imshow(WINDOW_NAME, img)
        toc = time.time()
        curr_fps = 1.0 / (toc - tic)
        # calculate an exponentially decaying average of fps number
        fps = curr_fps if fps == 0.0 else (fps*0.95 + curr_fps*0.05)
        tic = toc

        ###############################TODO
        detection2d = Detection2DArray() # create Detection2DArray ros msg (vision_msg)
        detection = Detection2D() # create Detection2D ros msg(vision_msg)
        detection2d.header.stamp = rospy.Time.now()
        detection2d.header.frame_id = "camera"
        msg = Float32MultiArray() # create Float32MultiArray type ros msg(std_msg)
        msg2 = Float32MultiArray()# create Float32MultiArray type ros msg(std_msg)
        msg.data =[]
        msg2.data =[]
        for i in range(len(boxes)):

            for _ in boxes:
                detection.header.stamp = rospy.Time.now()
                detection.header.frame_id="camera"
                #detection.results.id = clss[i]
                #detection.results.score = confs[i]

                detection.bbox.center.x = boxes[i][0] + (boxes[i][2] - boxes[i][0])/2 # get bounding center x
                detection.bbox.center.y = boxes[i][1] + (boxes[i][3] - boxes[i][1])/2 # get bounding cetner y
                #detection.bbox.center.theta = 0.0

                detection.bbox.size_x = abs(boxes[i][0] - boxes[i][2]) # get bounding x size
                detection.bbox.size_y = abs(boxes[i][1] - boxes[i][3]) # get bounding y size

            msg.data.append(confs[i]) # append confidence inform to list
            msg2.data.append(clss[i]) # append class inform to list
            detection2d.detections.append(detection) # append bounding box inform to Detection2DArray
        pub2.publish(msg) # send msg confidence
        pub3.publish(msg2) # send msg class
        pub.publish(detection2d) # send msg bounding box
        #r.sleep() # to downgrade FPS
        #detection.bbox
        #msg = Float32MultiArray()
        #msg.data = [boxes, confs, clss]
				#pub.publish(msg)
        #print("data:",msg.data)
        #print("boxes:",boxes)
        #print("clss:",clss)
        #pub.publish(msg)

        ###################3
        key = cv2.waitKey(1)
        if key == 27:  # ESC key: quit program
            break
        elif key == ord('F') or key == ord('f'):  # Toggle fullscreen
            full_scrn = not full_scrn
            set_display(WINDOW_NAME, full_scrn)

def main(publisher, publisher2, publisher3):
    pub = publisher
    pub2 = publisher2
    pub3 = publisher3
    args = parse_args()
    if args.category_num <= 0:
        raise SystemExit('ERROR: bad category_num (%d)!' % args.category_num)
    if not os.path.isfile('yolo/%s.trt' % args.model):
        raise SystemExit('ERROR: file (yolo/%s.trt) not found!' % args.model)

    cam = Camera(args)
    if not cam.isOpened():
        raise SystemExit('ERROR: failed to open camera!')

    cls_dict = get_cls_dict(args.category_num)
    vis = BBoxVisualization(cls_dict)
    trt_yolo = TrtYOLO(args.model, args.category_num, args.letter_box)

    open_window(
        WINDOW_NAME, 'Camera TensorRT YOLO Demo',
        cam.img_width, cam.img_height)
    loop_and_detect(pub,pub2, cam, trt_yolo, conf_th=0.3, vis=vis)

    cam.release()
    cv2.destroyAllWindows()

if __name__ == '__main__':
    rospy.init_node('VisionYOLO', anonymous=False) # create node
    pub = rospy.Publisher('/bbox', Detection2DArray , queue_size=1) # create bbox msg 
    pub2 = rospy.Publisher('/confs', Float32MultiArray , queue_size=1) # create confs msg
    pub3 = rospy.Publisher('/clss', Float32MultiArray , queue_size=1) # create clss msg
	  main(pub, pub2, pub3)

terminal

start roscore

roscore

check usb_cam number(ls dev/video*)
start object-detection( —usb : video number, -m : model name)

python3 trt_yolo.py --usb 1 -m yolov4-tiny-416

to turn off this python CTRL+Z → ps → kill -9 pid

check rostopic

rostopic list
rostopic echo /bbox (or /clss or /confs)

execute subscribetest.py