ScanNet200 3D Semantic Label Benchmark
The 3D semantic labeling task involves predicting a semantic labeling of a 3D scan mesh.
Evaluation and metricsOur evaluation ranks all methods according to the PASCAL VOC intersection-over-union metric (IoU). IoU = TP/(TP+FP+FN), where TP, FP, and FN are the numbers of true positive, false positive, and false negative pixels, respectively. Predicted labels are evaluated per-vertex over the respective 3D scan mesh; for 3D approaches that operate on other representations like grids or points, the predicted labels should be mapped onto the mesh vertices (e.g., one such example for grid to mesh vertices is provided in the evaluation helpers).
This table lists the benchmark results for the ScanNet200 3D semantic label scenario.
| Method | Info | avg iou | head iou | common iou | tail iou | wall | chair | floor | table | door | couch | cabinet | shelf | desk | office chair | bed | pillow | sink | picture | window | toilet | bookshelf | monitor | curtain | book | armchair | coffee table | box | refrigerator | lamp | kitchen cabinet | towel | clothes | tv | nightstand | counter | dresser | stool | cushion | plant | ceiling | bathtub | end table | dining table | keyboard | bag | backpack | toilet paper | printer | tv stand | whiteboard | blanket | shower curtain | trash can | closet | stairs | microwave | stove | shoe | computer tower | bottle | bin | ottoman | bench | board | washing machine | mirror | copier | basket | sofa chair | file cabinet | fan | laptop | shower | paper | person | paper towel dispenser | oven | blinds | rack | plate | blackboard | piano | suitcase | rail | radiator | recycling bin | container | wardrobe | soap dispenser | telephone | bucket | clock | stand | light | laundry basket | pipe | clothes dryer | guitar | toilet paper holder | seat | speaker | column | bicycle | ladder | bathroom stall | shower wall | cup | jacket | storage bin | coffee maker | dishwasher | paper towel roll | machine | mat | windowsill | bar | toaster | bulletin board | ironing board | fireplace | soap dish | kitchen counter | doorframe | toilet paper dispenser | mini fridge | fire extinguisher | ball | hat | shower curtain rod | water cooler | paper cutter | tray | shower door | pillar | ledge | toaster oven | mouse | toilet seat cover dispenser | furniture | cart | storage container | scale | tissue box | light switch | crate | power outlet | decoration | sign | projector | closet door | vacuum cleaner | candle | plunger | stuffed animal | headphones | dish rack | broom | guitar case | range hood | dustpan | hair dryer | water bottle | handicap bar | purse | vent | shower floor | water pitcher | mailbox | bowl | paper bag | alarm clock | music stand | projector screen | divider | laundry detergent | bathroom counter | object | bathroom vanity | closet wall | laundry hamper | bathroom stall door | ceiling light | trash bin | dumbbell | stair rail | tube | bathroom cabinet | cd case | closet rod | coffee kettle | structure | shower head | keyboard piano | case of water bottles | coat rack | storage organizer | folded chair | fire alarm | power strip | calendar | poster | potted plant | luggage | mattress |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ALS-MinkowskiNet | 0.414 3 | 0.610 3 | 0.322 3 | 0.271 2 | 0.852 1 | 0.710 3 | 0.973 1 | 0.572 5 | 0.719 4 | 0.795 2 | 0.477 7 | 0.506 3 | 0.601 4 | 0.000 14 | 0.804 5 | 0.646 4 | 0.804 3 | 0.344 2 | 0.777 1 | 0.984 1 | 0.671 1 | 0.879 3 | 0.936 1 | 0.342 5 | 0.632 8 | 0.449 4 | 0.817 3 | 0.475 10 | 0.723 2 | 0.798 1 | 0.376 9 | 0.832 3 | 0.693 1 | 0.031 9 | 0.564 1 | 0.510 14 | 0.000 1 | 0.893 3 | 0.905 1 | 0.672 17 | 0.314 1 | 0.000 7 | 0.718 1 | 0.153 3 | 0.542 2 | 0.397 4 | 0.726 3 | 0.752 9 | 0.252 9 | 0.226 3 | 0.916 2 | 0.800 1 | 0.047 17 | 0.807 4 | 0.769 1 | 0.709 3 | 0.630 4 | 0.769 1 | 0.217 11 | 0.000 3 | 0.285 1 | 0.598 5 | 0.846 11 | 0.535 1 | 0.956 5 | 0.000 8 | 0.137 11 | 0.784 3 | 0.464 8 | 0.463 14 | 0.230 13 | 0.000 1 | 0.598 4 | 0.662 9 | 0.000 4 | 0.087 2 | 0.000 1 | 0.135 3 | 0.900 3 | 0.780 12 | 0.703 3 | 0.741 1 | 0.571 2 | 0.149 10 | 0.697 8 | 0.646 2 | 0.000 3 | 0.076 3 | 0.000 1 | 0.025 11 | 0.000 4 | 0.106 6 | 0.981 1 | 0.000 1 | 0.043 8 | 0.113 4 | 0.888 3 | 0.248 16 | 0.404 4 | 0.252 7 | 0.314 1 | 0.220 8 | 0.245 2 | 0.466 7 | 0.366 3 | 0.159 2 | 0.000 5 | 0.149 8 | 0.690 2 | 0.000 3 | 0.531 6 | 0.253 3 | 0.285 6 | 0.460 1 | 0.440 6 | 0.813 1 | 0.230 3 | 0.283 6 | 0.159 12 | 0.000 1 | 0.728 1 | 0.666 5 | 0.958 1 | 0.000 1 | 0.021 5 | 0.252 9 | 0.118 6 | 0.000 7 | 0.445 4 | 0.223 11 | 0.285 1 | 0.194 3 | 0.390 2 | 0.000 1 | 0.475 4 | 0.842 8 | 0.000 1 | 0.455 4 | 0.000 1 | 0.250 8 | 0.458 9 | 0.000 1 | 0.865 2 | 0.000 1 | 0.000 1 | 0.635 1 | 0.359 6 | 0.972 1 | 0.087 4 | 0.447 1 | 0.000 1 | 0.000 9 | 0.000 1 | 0.129 2 | 0.532 7 | 0.446 9 | 0.503 5 | 0.071 14 | 0.135 13 | 0.699 4 | 0.717 3 | 0.097 2 | 0.000 1 | 0.665 2 | 0.000 2 | 0.000 2 | 1.000 1 | 0.752 6 | 0.000 3 | 0.000 1 | 0.000 1 | 0.142 9 | 0.200 1 | 0.259 1 | 1.000 1 | 0.000 1 | |||||||||||||||||||||||||||||
| Guangda Ji, Silvan Weder, Francis Engelmann, Marc Pollefeys, Hermann Blum: ARKit LabelMaker: A New Scale for Indoor 3D Scene Understanding. CVPR 2025 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| PTv3 ScanNet200 | 0.393 4 | 0.592 4 | 0.330 2 | 0.216 4 | 0.851 2 | 0.687 7 | 0.971 2 | 0.586 3 | 0.755 1 | 0.752 8 | 0.505 2 | 0.404 8 | 0.575 6 | 0.000 14 | 0.848 2 | 0.616 5 | 0.761 4 | 0.349 1 | 0.738 3 | 0.978 4 | 0.546 7 | 0.860 9 | 0.926 3 | 0.346 4 | 0.654 3 | 0.384 8 | 0.828 1 | 0.523 4 | 0.699 4 | 0.583 7 | 0.387 8 | 0.822 4 | 0.688 2 | 0.118 4 | 0.474 3 | 0.603 5 | 0.000 1 | 0.832 9 | 0.903 2 | 0.753 10 | 0.140 10 | 0.000 7 | 0.650 4 | 0.109 6 | 0.520 4 | 0.457 3 | 0.497 11 | 0.871 4 | 0.281 5 | 0.192 6 | 0.887 5 | 0.748 3 | 0.168 2 | 0.727 8 | 0.733 2 | 0.740 1 | 0.644 2 | 0.714 5 | 0.190 14 | 0.000 3 | 0.256 3 | 0.449 11 | 0.914 1 | 0.514 2 | 0.759 16 | 0.337 2 | 0.172 6 | 0.692 8 | 0.617 3 | 0.636 1 | 0.325 8 | 0.000 1 | 0.641 2 | 0.782 2 | 0.000 4 | 0.065 4 | 0.000 1 | 0.000 6 | 0.842 5 | 0.903 2 | 0.661 5 | 0.662 4 | 0.612 1 | 0.405 2 | 0.731 5 | 0.566 5 | 0.000 3 | 0.000 8 | 0.000 1 | 0.017 15 | 0.301 1 | 0.088 7 | 0.941 4 | 0.000 1 | 0.077 4 | 0.000 10 | 0.717 9 | 0.790 2 | 0.310 13 | 0.026 18 | 0.264 5 | 0.349 1 | 0.220 5 | 0.397 13 | 0.366 3 | 0.115 14 | 0.000 5 | 0.337 1 | 0.463 6 | 0.000 3 | 0.531 6 | 0.218 5 | 0.593 2 | 0.455 2 | 0.469 3 | 0.708 4 | 0.210 5 | 0.592 4 | 0.108 17 | 0.000 1 | 0.728 1 | 0.682 3 | 0.671 9 | 0.000 1 | 0.000 12 | 0.407 1 | 0.136 5 | 0.022 3 | 0.575 2 | 0.436 4 | 0.259 3 | 0.428 1 | 0.048 6 | 0.000 1 | 0.000 5 | 0.879 6 | 0.000 1 | 0.480 3 | 0.000 1 | 0.133 10 | 0.597 2 | 0.000 1 | 0.690 3 | 0.000 1 | 0.000 1 | 0.009 17 | 0.000 16 | 0.921 4 | 0.000 10 | 0.151 6 | 0.000 1 | 0.000 9 | 0.000 1 | 0.109 8 | 0.494 12 | 0.622 2 | 0.394 10 | 0.073 13 | 0.141 7 | 0.798 2 | 0.528 9 | 0.026 5 | 0.000 1 | 0.551 6 | 0.000 2 | 0.000 2 | 0.134 8 | 0.717 9 | 0.000 3 | 0.000 1 | 0.000 1 | 0.188 4 | 0.000 7 | 0.000 3 | 0.791 3 | 0.000 1 | |||||||||||||||||||||||||||||
| Xiaoyang Wu, Li Jiang, Peng-Shuai Wang, Zhijian Liu, Xihui Liu, Yu Qiao, Wanli Ouyang, Tong He, Hengshuang Zhao: Point Transformer V3: Simpler, Faster, Stronger. CVPR 2024 (Oral) | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| DITR | 0.449 1 | 0.629 1 | 0.392 1 | 0.289 1 | 0.851 2 | 0.727 2 | 0.969 4 | 0.600 2 | 0.741 3 | 0.805 1 | 0.519 1 | 0.480 4 | 0.636 1 | 0.014 10 | 0.867 1 | 0.680 2 | 0.849 1 | 0.318 4 | 0.753 2 | 0.982 2 | 0.508 13 | 0.871 7 | 0.934 2 | 0.482 1 | 0.596 12 | 0.551 2 | 0.804 4 | 0.508 6 | 0.729 1 | 0.718 2 | 0.417 5 | 0.886 2 | 0.664 3 | 0.000 17 | 0.500 2 | 0.698 1 | 0.000 1 | 0.913 1 | 0.901 3 | 0.766 8 | 0.113 12 | 0.000 7 | 0.617 6 | 0.168 2 | 0.650 1 | 0.477 2 | 0.826 1 | 0.962 1 | 0.348 4 | 0.300 1 | 0.947 1 | 0.776 2 | 0.160 3 | 0.889 2 | 0.651 5 | 0.720 2 | 0.700 1 | 0.728 3 | 0.317 1 | 0.000 3 | 0.238 5 | 0.664 1 | 0.869 5 | 0.514 2 | 0.998 1 | 0.313 4 | 0.138 10 | 0.815 2 | 0.828 1 | 0.622 2 | 0.421 6 | 0.000 1 | 0.823 1 | 0.817 1 | 0.000 4 | 0.000 10 | 0.000 1 | 0.157 2 | 0.866 4 | 0.991 1 | 0.805 1 | 0.660 5 | 0.571 2 | 0.043 13 | 0.709 7 | 0.642 3 | 0.000 3 | 0.000 8 | 0.000 1 | 0.028 10 | 0.018 3 | 0.134 3 | 0.967 3 | 0.000 1 | 0.150 2 | 0.130 2 | 0.949 1 | 0.855 1 | 0.580 1 | 0.262 5 | 0.314 1 | 0.230 6 | 0.222 4 | 0.498 5 | 0.367 2 | 0.153 3 | 0.869 1 | 0.334 2 | 0.397 8 | 0.000 3 | 0.904 1 | 0.486 2 | 1.000 1 | 0.423 4 | 0.484 2 | 0.632 7 | 0.716 1 | 0.733 2 | 0.862 1 | 0.000 1 | 0.433 15 | 0.710 1 | 0.851 3 | 0.000 1 | 0.034 4 | 0.315 4 | 0.385 1 | 0.000 7 | 0.001 10 | 0.268 10 | 0.066 12 | 0.000 8 | 0.278 4 | 0.000 1 | 0.978 1 | 0.839 9 | 0.000 1 | 0.448 5 | 0.000 1 | 0.579 1 | 0.403 13 | 0.000 1 | 0.647 4 | 0.000 1 | 0.000 1 | 0.411 4 | 0.315 7 | 0.904 8 | 0.420 1 | 0.392 3 | 0.000 1 | 0.091 6 | 0.000 1 | 0.128 3 | 0.564 4 | 0.591 3 | 0.568 2 | 0.079 10 | 0.139 10 | 1.000 1 | 0.714 4 | 0.178 1 | 0.000 1 | 0.606 4 | 0.000 2 | 0.000 2 | 0.148 7 | 0.983 1 | 0.000 3 | 0.000 1 | 0.000 1 | 0.374 2 | 0.000 7 | 0.000 3 | 0.662 5 | 0.000 1 | |||||||||||||||||||||||||||||
| Karim Abou Zeid, Kadir Yilmaz, Daan de Geus, Alexander Hermans, David Adrian, Timm Linder, Bastian Leibe: DINO in the Room: Leveraging 2D Foundation Models for 3D Segmentation. 3DV 2026 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ODIN - Sem200 | 0.368 5 | 0.562 5 | 0.297 5 | 0.207 5 | 0.800 11 | 0.669 14 | 0.940 11 | 0.575 4 | 0.654 10 | 0.749 9 | 0.487 4 | 0.589 1 | 0.609 3 | 0.001 12 | 0.769 13 | 0.561 9 | 0.752 7 | 0.274 6 | 0.682 7 | 0.926 14 | 0.554 5 | 0.833 15 | 0.921 4 | 0.389 2 | 0.599 11 | 0.591 1 | 0.787 8 | 0.550 2 | 0.657 6 | 0.610 5 | 0.334 14 | 0.803 9 | 0.661 4 | 0.090 6 | 0.408 7 | 0.373 16 | 0.000 1 | 0.912 2 | 0.796 18 | 0.501 18 | 0.169 8 | 0.000 7 | 0.641 5 | 0.196 1 | 0.380 18 | 0.397 4 | 0.641 6 | 0.740 10 | 0.862 1 | 0.213 4 | 0.857 7 | 0.685 8 | 0.216 1 | 0.578 17 | 0.557 11 | 0.685 5 | 0.523 9 | 0.581 17 | 0.312 3 | 0.000 3 | 0.065 16 | 0.000 18 | 0.871 4 | 0.359 9 | 0.988 2 | 0.321 3 | 0.090 17 | 0.704 7 | 0.631 2 | 0.393 16 | 0.246 12 | 0.000 1 | 0.482 9 | 0.565 16 | 0.000 4 | 0.000 10 | 0.000 1 | 0.181 1 | 0.913 1 | 0.468 17 | 0.632 9 | 0.642 6 | 0.259 12 | 0.000 18 | 0.832 1 | 0.663 1 | 0.000 3 | 0.081 2 | 0.000 1 | 0.048 2 | 0.000 4 | 0.376 1 | 0.898 8 | 0.000 1 | 0.157 1 | 0.000 10 | 0.870 4 | 0.000 18 | 0.400 5 | 0.265 4 | 0.242 6 | 0.227 7 | 0.539 1 | 0.370 15 | 0.214 14 | 0.129 11 | 0.000 5 | 0.131 10 | 0.054 18 | 0.000 3 | 0.358 10 | 0.491 1 | 0.462 4 | 0.434 3 | 0.346 16 | 0.454 16 | 0.316 2 | 0.814 1 | 0.828 3 | 0.000 1 | 0.000 18 | 0.220 18 | 0.612 12 | 0.000 1 | 0.000 12 | 0.373 3 | 0.378 2 | 0.000 7 | 0.429 5 | 0.152 12 | 0.077 10 | 0.166 4 | 0.202 5 | 0.000 1 | 0.000 5 | 0.441 15 | 0.000 1 | 0.440 7 | 0.000 1 | 0.000 13 | 0.655 1 | 0.000 1 | 0.626 8 | 0.000 1 | 0.000 1 | 0.228 10 | 0.487 2 | 0.784 17 | 0.000 10 | 0.301 4 | 0.000 1 | 0.426 2 | 0.000 1 | 0.108 9 | 0.460 14 | 0.590 4 | 0.775 1 | 0.088 6 | 0.119 16 | 0.485 9 | 0.791 2 | 0.000 12 | 0.000 1 | 0.256 18 | 0.000 2 | 0.000 2 | 0.000 12 | 0.885 3 | 0.303 1 | 0.000 1 | 0.000 1 | 0.127 17 | 0.000 7 | 0.000 3 | 0.894 2 | 0.000 1 | |||||||||||||||||||||||||||||
| Ayush Jain, Pushkal Katara, Nikolaos Gkanatsios, Adam W. Harley, Gabriel Sarch, Kriti Aggarwal, Vishrav Chaudhary, Katerina Fragkiadaki: ODIN: A Single Model for 2D and 3D Segmentation. CVPR 2024 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Volt | 0.416 2 | 0.619 2 | 0.318 4 | 0.269 3 | 0.850 4 | 0.735 1 | 0.958 5 | 0.639 1 | 0.753 2 | 0.773 3 | 0.504 3 | 0.542 2 | 0.631 2 | 0.000 14 | 0.795 7 | 0.686 1 | 0.834 2 | 0.335 3 | 0.721 4 | 0.982 2 | 0.625 2 | 0.884 2 | 0.905 5 | 0.237 13 | 0.653 4 | 0.429 5 | 0.679 15 | 0.462 11 | 0.709 3 | 0.680 3 | 0.475 1 | 0.893 1 | 0.652 5 | 0.000 17 | 0.392 9 | 0.541 12 | 0.000 1 | 0.865 4 | 0.900 5 | 0.952 1 | 0.000 17 | 0.000 7 | 0.700 2 | 0.138 4 | 0.528 3 | 0.501 1 | 0.678 4 | 0.842 6 | 0.357 3 | 0.227 2 | 0.909 3 | 0.719 4 | 0.093 8 | 0.924 1 | 0.614 8 | 0.682 6 | 0.635 3 | 0.696 8 | 0.238 8 | 0.000 3 | 0.143 13 | 0.606 4 | 0.898 2 | 0.430 4 | 0.988 2 | 0.356 1 | 0.136 12 | 0.881 1 | 0.609 4 | 0.583 3 | 0.588 1 | 0.000 1 | 0.624 3 | 0.635 11 | 0.000 4 | 0.087 2 | 0.000 1 | 0.000 6 | 0.904 2 | 0.903 2 | 0.747 2 | 0.696 2 | 0.410 8 | 0.272 7 | 0.737 4 | 0.603 4 | 0.000 3 | 0.097 1 | 0.000 1 | 0.007 17 | 0.000 4 | 0.063 11 | 0.981 1 | 0.000 1 | 0.066 5 | 0.000 10 | 0.891 2 | 0.431 9 | 0.380 8 | 0.261 6 | 0.265 4 | 0.274 4 | 0.069 10 | 0.425 9 | 0.401 1 | 0.151 4 | 0.631 2 | 0.005 16 | 0.324 13 | 0.000 3 | 0.778 2 | 0.251 4 | 0.000 15 | 0.421 5 | 0.499 1 | 0.725 3 | 0.223 4 | 0.277 7 | 0.862 1 | 0.000 1 | 0.728 1 | 0.351 14 | 0.855 2 | 0.000 1 | 0.020 6 | 0.407 1 | 0.218 4 | 0.000 7 | 0.997 1 | 0.329 8 | 0.218 4 | 0.000 8 | 0.000 11 | 0.000 1 | 0.000 5 | 0.930 1 | 0.000 1 | 0.551 1 | 0.000 1 | 0.518 2 | 0.493 8 | 0.000 1 | 0.962 1 | 0.000 1 | 0.000 1 | 0.414 3 | 0.576 1 | 0.934 2 | 0.188 3 | 0.398 2 | 0.000 1 | 0.000 9 | 0.000 1 | 0.040 18 | 0.616 2 | 0.553 5 | 0.438 7 | 0.082 8 | 0.141 7 | 0.437 12 | 0.888 1 | 0.000 12 | 0.000 1 | 0.754 1 | 0.000 2 | 0.000 2 | 1.000 1 | 0.752 6 | 0.000 3 | 0.000 1 | 0.000 1 | 0.142 9 | 0.000 7 | 0.000 3 | 0.791 3 | 0.000 1 | |||||||||||||||||||||||||||||
| Kadir Yilmaz, Adrian Kruse, Tristan Höfer, Daan de Geus, Bastian Leibe: Volume Transformer: Revisiting Vanilla Transformers for 3D Scene Understanding. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| CeCo | 0.340 8 | 0.551 10 | 0.247 14 | 0.181 7 | 0.784 14 | 0.661 15 | 0.939 14 | 0.564 7 | 0.624 14 | 0.721 13 | 0.484 6 | 0.429 6 | 0.575 6 | 0.027 8 | 0.774 12 | 0.503 15 | 0.753 6 | 0.242 14 | 0.656 12 | 0.945 10 | 0.534 8 | 0.865 8 | 0.860 12 | 0.177 18 | 0.616 9 | 0.400 6 | 0.818 2 | 0.579 1 | 0.615 12 | 0.367 15 | 0.408 7 | 0.726 16 | 0.633 6 | 0.162 1 | 0.360 10 | 0.619 3 | 0.000 1 | 0.828 10 | 0.873 10 | 0.924 3 | 0.109 13 | 0.083 3 | 0.564 7 | 0.057 16 | 0.475 13 | 0.266 12 | 0.781 2 | 0.767 8 | 0.257 8 | 0.100 12 | 0.825 12 | 0.663 11 | 0.048 16 | 0.620 14 | 0.551 13 | 0.595 14 | 0.532 8 | 0.692 9 | 0.246 6 | 0.000 3 | 0.213 6 | 0.615 2 | 0.861 8 | 0.376 8 | 0.900 9 | 0.000 8 | 0.102 16 | 0.660 9 | 0.321 16 | 0.547 6 | 0.226 14 | 0.000 1 | 0.311 14 | 0.742 5 | 0.011 3 | 0.006 9 | 0.000 1 | 0.000 6 | 0.546 16 | 0.824 9 | 0.345 15 | 0.665 3 | 0.450 6 | 0.435 1 | 0.683 9 | 0.411 9 | 0.338 1 | 0.000 8 | 0.000 1 | 0.030 9 | 0.000 4 | 0.068 9 | 0.892 9 | 0.000 1 | 0.063 6 | 0.000 10 | 0.257 14 | 0.304 14 | 0.387 6 | 0.079 15 | 0.228 7 | 0.190 12 | 0.000 15 | 0.586 1 | 0.347 5 | 0.133 8 | 0.000 5 | 0.037 13 | 0.377 10 | 0.000 3 | 0.384 9 | 0.006 17 | 0.003 13 | 0.421 5 | 0.410 11 | 0.643 6 | 0.171 10 | 0.121 10 | 0.142 13 | 0.000 1 | 0.510 12 | 0.447 11 | 0.474 15 | 0.000 1 | 0.000 12 | 0.286 6 | 0.083 12 | 0.000 7 | 0.000 11 | 0.603 1 | 0.096 8 | 0.063 5 | 0.000 11 | 0.000 1 | 0.000 5 | 0.898 4 | 0.000 1 | 0.429 8 | 0.000 1 | 0.400 3 | 0.550 4 | 0.000 1 | 0.633 7 | 0.000 1 | 0.000 1 | 0.377 6 | 0.000 16 | 0.916 5 | 0.000 10 | 0.000 12 | 0.000 1 | 0.000 9 | 0.000 1 | 0.102 12 | 0.499 10 | 0.296 15 | 0.463 6 | 0.089 5 | 0.304 1 | 0.740 3 | 0.401 17 | 0.010 7 | 0.000 1 | 0.560 5 | 0.000 2 | 0.000 2 | 0.709 3 | 0.652 11 | 0.000 3 | 0.000 1 | 0.000 1 | 0.143 8 | 0.000 7 | 0.000 3 | 0.609 6 | 0.000 1 | |||||||||||||||||||||||||||||
| Zhisheng Zhong, Jiequan Cui, Yibo Yang, Xiaoyang Wu, Xiaojuan Qi, Xiangyu Zhang, Jiaya Jia: Understanding Imbalanced Semantic Segmentation Through Neural Collapse. CVPR 2023 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| L3DETR-ScanNet_200 | 0.336 9 | 0.533 12 | 0.279 7 | 0.155 11 | 0.801 10 | 0.689 5 | 0.946 7 | 0.539 12 | 0.660 8 | 0.759 5 | 0.380 15 | 0.333 15 | 0.583 5 | 0.000 14 | 0.788 11 | 0.529 11 | 0.740 9 | 0.261 13 | 0.679 10 | 0.940 13 | 0.525 11 | 0.860 9 | 0.883 8 | 0.226 14 | 0.613 10 | 0.397 7 | 0.720 11 | 0.512 5 | 0.565 13 | 0.620 4 | 0.417 5 | 0.775 14 | 0.629 7 | 0.158 2 | 0.298 13 | 0.579 11 | 0.000 1 | 0.835 7 | 0.883 7 | 0.927 2 | 0.114 11 | 0.079 4 | 0.511 11 | 0.073 12 | 0.508 6 | 0.312 7 | 0.629 7 | 0.861 5 | 0.192 15 | 0.098 14 | 0.908 4 | 0.636 12 | 0.032 18 | 0.563 18 | 0.514 16 | 0.664 7 | 0.505 11 | 0.697 7 | 0.225 10 | 0.000 3 | 0.264 2 | 0.411 13 | 0.860 9 | 0.321 14 | 0.960 4 | 0.058 7 | 0.109 14 | 0.776 4 | 0.526 6 | 0.557 4 | 0.303 10 | 0.000 1 | 0.339 13 | 0.712 7 | 0.000 4 | 0.014 8 | 0.000 1 | 0.000 6 | 0.638 13 | 0.856 5 | 0.641 8 | 0.579 12 | 0.107 18 | 0.119 12 | 0.661 12 | 0.416 8 | 0.000 3 | 0.000 8 | 0.000 1 | 0.007 17 | 0.000 4 | 0.067 10 | 0.910 6 | 0.000 1 | 0.000 11 | 0.000 10 | 0.463 12 | 0.448 8 | 0.294 15 | 0.324 1 | 0.293 3 | 0.211 9 | 0.108 8 | 0.448 8 | 0.068 18 | 0.141 7 | 0.000 5 | 0.330 3 | 0.699 1 | 0.000 3 | 0.256 12 | 0.192 7 | 0.000 15 | 0.355 9 | 0.418 8 | 0.209 18 | 0.146 13 | 0.679 3 | 0.101 18 | 0.000 1 | 0.503 14 | 0.687 2 | 0.671 9 | 0.000 1 | 0.000 12 | 0.174 12 | 0.117 7 | 0.000 7 | 0.122 8 | 0.515 2 | 0.104 7 | 0.259 2 | 0.312 3 | 0.000 1 | 0.000 5 | 0.765 13 | 0.000 1 | 0.369 13 | 0.000 1 | 0.183 9 | 0.422 12 | 0.000 1 | 0.646 5 | 0.000 1 | 0.000 1 | 0.565 2 | 0.001 15 | 0.125 18 | 0.010 8 | 0.002 11 | 0.000 1 | 0.487 1 | 0.000 1 | 0.075 14 | 0.548 5 | 0.420 10 | 0.233 15 | 0.082 8 | 0.138 12 | 0.430 13 | 0.427 14 | 0.000 12 | 0.000 1 | 0.549 7 | 0.000 2 | 0.000 2 | 0.074 9 | 0.409 17 | 0.000 3 | 0.000 1 | 0.000 1 | 0.152 7 | 0.051 3 | 0.000 3 | 0.598 7 | 0.000 1 | |||||||||||||||||||||||||||||
| Yanmin Wu, Qiankun Gao, Renrui Zhang, Jian Zhang: Language-Assisted 3D Scene Understanding. arXiv23.12 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| PPT-SpUNet-F.T. | 0.332 13 | 0.556 7 | 0.270 8 | 0.123 15 | 0.816 7 | 0.682 10 | 0.946 7 | 0.549 11 | 0.657 9 | 0.756 6 | 0.459 8 | 0.376 10 | 0.550 12 | 0.001 12 | 0.807 4 | 0.616 5 | 0.727 13 | 0.267 10 | 0.691 6 | 0.942 12 | 0.530 10 | 0.872 6 | 0.874 9 | 0.330 8 | 0.542 15 | 0.374 9 | 0.792 5 | 0.400 15 | 0.673 5 | 0.572 8 | 0.433 3 | 0.793 10 | 0.623 8 | 0.008 16 | 0.351 11 | 0.594 8 | 0.000 1 | 0.783 14 | 0.876 8 | 0.833 5 | 0.213 6 | 0.000 7 | 0.537 9 | 0.091 8 | 0.519 5 | 0.304 9 | 0.620 9 | 0.942 2 | 0.264 6 | 0.124 9 | 0.855 8 | 0.695 6 | 0.086 9 | 0.646 11 | 0.506 17 | 0.658 8 | 0.535 7 | 0.715 4 | 0.314 2 | 0.000 3 | 0.241 4 | 0.608 3 | 0.897 3 | 0.359 9 | 0.858 12 | 0.000 8 | 0.076 18 | 0.611 12 | 0.392 13 | 0.509 8 | 0.378 7 | 0.000 1 | 0.579 5 | 0.565 16 | 0.000 4 | 0.000 10 | 0.000 1 | 0.000 6 | 0.755 8 | 0.806 10 | 0.661 5 | 0.572 14 | 0.350 10 | 0.181 8 | 0.660 13 | 0.300 15 | 0.000 3 | 0.000 8 | 0.000 1 | 0.023 12 | 0.000 4 | 0.042 15 | 0.930 5 | 0.000 1 | 0.000 11 | 0.077 7 | 0.584 10 | 0.392 11 | 0.339 10 | 0.185 11 | 0.171 13 | 0.308 2 | 0.006 14 | 0.563 3 | 0.256 9 | 0.150 5 | 0.000 5 | 0.002 17 | 0.345 12 | 0.000 3 | 0.045 15 | 0.197 6 | 0.063 11 | 0.323 12 | 0.453 5 | 0.600 9 | 0.163 12 | 0.037 16 | 0.349 5 | 0.000 1 | 0.672 4 | 0.679 4 | 0.753 6 | 0.000 1 | 0.000 12 | 0.000 13 | 0.117 7 | 0.000 7 | 0.000 11 | 0.291 9 | 0.000 13 | 0.000 8 | 0.039 7 | 0.000 1 | 0.000 5 | 0.899 3 | 0.000 1 | 0.374 12 | 0.000 1 | 0.000 13 | 0.545 5 | 0.000 1 | 0.634 6 | 0.000 1 | 0.000 1 | 0.074 14 | 0.223 9 | 0.914 7 | 0.000 10 | 0.021 10 | 0.000 1 | 0.000 9 | 0.000 1 | 0.112 6 | 0.498 11 | 0.649 1 | 0.383 11 | 0.095 2 | 0.135 13 | 0.449 11 | 0.432 13 | 0.008 9 | 0.000 1 | 0.518 8 | 0.000 2 | 0.000 2 | 0.000 12 | 0.796 5 | 0.000 3 | 0.000 1 | 0.000 1 | 0.138 14 | 0.000 7 | 0.000 3 | 0.000 12 | 0.000 1 | |||||||||||||||||||||||||||||
| Xiaoyang Wu, Zhuotao Tian, Xin Wen, Bohao Peng, Xihui Liu, Kaicheng Yu, Hengshuang Zhao: Towards Large-scale 3D Representation Learning with Multi-dataset Point Prompt Training. CVPR 2024 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| PonderV2 ScanNet200 | 0.346 7 | 0.552 9 | 0.270 9 | 0.175 10 | 0.810 8 | 0.682 10 | 0.950 6 | 0.560 8 | 0.641 11 | 0.761 4 | 0.398 14 | 0.357 11 | 0.570 9 | 0.113 2 | 0.804 5 | 0.603 7 | 0.750 8 | 0.283 5 | 0.681 8 | 0.952 6 | 0.548 6 | 0.874 5 | 0.852 14 | 0.290 12 | 0.700 2 | 0.356 12 | 0.792 5 | 0.445 13 | 0.545 14 | 0.436 13 | 0.351 13 | 0.787 11 | 0.611 9 | 0.050 8 | 0.290 15 | 0.519 13 | 0.000 1 | 0.825 11 | 0.888 6 | 0.842 4 | 0.259 3 | 0.100 2 | 0.558 8 | 0.070 13 | 0.497 8 | 0.247 15 | 0.457 12 | 0.889 3 | 0.248 10 | 0.106 11 | 0.817 14 | 0.691 7 | 0.094 7 | 0.729 7 | 0.636 6 | 0.620 13 | 0.503 12 | 0.660 14 | 0.243 7 | 0.000 3 | 0.212 7 | 0.590 6 | 0.860 9 | 0.400 6 | 0.881 10 | 0.000 8 | 0.202 2 | 0.622 11 | 0.408 12 | 0.499 9 | 0.261 11 | 0.000 1 | 0.385 11 | 0.636 10 | 0.000 4 | 0.000 10 | 0.000 1 | 0.000 6 | 0.433 17 | 0.843 7 | 0.660 7 | 0.574 13 | 0.481 4 | 0.336 4 | 0.677 10 | 0.486 7 | 0.000 3 | 0.030 4 | 0.000 1 | 0.034 6 | 0.000 4 | 0.080 8 | 0.869 11 | 0.000 1 | 0.000 11 | 0.000 10 | 0.540 11 | 0.727 3 | 0.232 18 | 0.115 12 | 0.186 11 | 0.193 10 | 0.000 15 | 0.403 12 | 0.326 7 | 0.103 15 | 0.000 5 | 0.290 4 | 0.392 9 | 0.000 3 | 0.346 11 | 0.062 11 | 0.424 5 | 0.375 8 | 0.431 7 | 0.667 5 | 0.115 15 | 0.082 13 | 0.239 8 | 0.000 1 | 0.504 13 | 0.606 8 | 0.584 13 | 0.000 1 | 0.002 10 | 0.186 11 | 0.104 11 | 0.000 7 | 0.394 6 | 0.384 6 | 0.083 9 | 0.000 8 | 0.007 9 | 0.000 1 | 0.000 5 | 0.880 5 | 0.000 1 | 0.377 11 | 0.000 1 | 0.263 7 | 0.565 3 | 0.000 1 | 0.608 10 | 0.000 1 | 0.000 1 | 0.304 8 | 0.009 12 | 0.924 3 | 0.000 10 | 0.000 12 | 0.000 1 | 0.000 9 | 0.000 1 | 0.128 3 | 0.584 3 | 0.475 8 | 0.412 9 | 0.076 12 | 0.269 3 | 0.621 6 | 0.509 10 | 0.010 7 | 0.000 1 | 0.491 12 | 0.063 1 | 0.000 2 | 0.472 5 | 0.880 4 | 0.000 3 | 0.000 1 | 0.000 1 | 0.179 5 | 0.125 2 | 0.000 3 | 0.441 11 | 0.000 1 | |||||||||||||||||||||||||||||
| Haoyi Zhu, Honghui Yang, Xiaoyang Wu, Di Huang, Sha Zhang, Xianglong He, Tong He, Hengshuang Zhao, Chunhua Shen, Yu Qiao, Wanli Ouyang: PonderV2: Pave the Way for 3D Foundataion Model with A Universal Pre-training Paradigm. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| AWCS | 0.305 15 | 0.508 15 | 0.225 15 | 0.142 12 | 0.782 15 | 0.634 18 | 0.937 15 | 0.489 16 | 0.578 15 | 0.721 13 | 0.364 16 | 0.355 12 | 0.515 13 | 0.023 9 | 0.764 15 | 0.523 12 | 0.707 15 | 0.264 12 | 0.633 15 | 0.922 15 | 0.507 14 | 0.886 1 | 0.804 16 | 0.179 16 | 0.436 17 | 0.300 13 | 0.656 17 | 0.529 3 | 0.501 16 | 0.394 14 | 0.296 17 | 0.820 6 | 0.603 10 | 0.131 3 | 0.179 18 | 0.619 3 | 0.000 1 | 0.707 17 | 0.865 14 | 0.773 7 | 0.171 7 | 0.010 6 | 0.484 15 | 0.063 14 | 0.463 14 | 0.254 14 | 0.332 17 | 0.649 12 | 0.220 12 | 0.100 12 | 0.729 16 | 0.613 16 | 0.071 14 | 0.582 15 | 0.628 7 | 0.702 4 | 0.424 16 | 0.749 2 | 0.137 16 | 0.000 3 | 0.142 14 | 0.360 14 | 0.863 7 | 0.305 15 | 0.877 11 | 0.000 8 | 0.173 5 | 0.606 13 | 0.337 15 | 0.478 13 | 0.154 16 | 0.000 1 | 0.253 15 | 0.664 8 | 0.000 4 | 0.000 10 | 0.000 1 | 0.000 6 | 0.626 14 | 0.782 11 | 0.302 17 | 0.602 8 | 0.185 14 | 0.282 6 | 0.651 14 | 0.317 14 | 0.000 3 | 0.000 8 | 0.000 1 | 0.022 13 | 0.000 4 | 0.154 2 | 0.876 10 | 0.000 1 | 0.014 10 | 0.063 9 | 0.029 18 | 0.553 7 | 0.467 3 | 0.084 14 | 0.124 15 | 0.157 17 | 0.049 13 | 0.373 14 | 0.252 10 | 0.097 16 | 0.000 5 | 0.219 7 | 0.542 3 | 0.000 3 | 0.392 8 | 0.172 9 | 0.000 15 | 0.339 10 | 0.417 9 | 0.533 14 | 0.093 16 | 0.115 11 | 0.195 10 | 0.000 1 | 0.516 11 | 0.288 16 | 0.741 7 | 0.000 1 | 0.001 11 | 0.233 10 | 0.056 15 | 0.000 7 | 0.159 7 | 0.334 7 | 0.077 10 | 0.000 8 | 0.000 11 | 0.000 1 | 0.000 5 | 0.749 14 | 0.000 1 | 0.411 9 | 0.000 1 | 0.008 12 | 0.452 11 | 0.000 1 | 0.595 11 | 0.000 1 | 0.000 1 | 0.220 11 | 0.006 13 | 0.894 13 | 0.006 9 | 0.000 12 | 0.000 1 | 0.000 9 | 0.000 1 | 0.112 6 | 0.504 9 | 0.404 11 | 0.551 3 | 0.093 4 | 0.129 15 | 0.484 10 | 0.381 18 | 0.000 12 | 0.000 1 | 0.396 15 | 0.000 2 | 0.000 2 | 0.620 4 | 0.402 18 | 0.000 3 | 0.000 1 | 0.000 1 | 0.142 9 | 0.000 7 | 0.000 3 | 0.512 10 | 0.000 1 | |||||||||||||||||||||||||||||
| : Long-Tailed 3D Semantic Segmentation with Adaptive Weight Constraint and Sampling. ICRA 2024 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| LGround | 0.272 16 | 0.485 16 | 0.184 16 | 0.106 16 | 0.778 16 | 0.676 12 | 0.932 16 | 0.479 18 | 0.572 16 | 0.718 15 | 0.399 13 | 0.265 16 | 0.453 17 | 0.085 3 | 0.745 16 | 0.446 16 | 0.726 14 | 0.232 16 | 0.622 16 | 0.901 16 | 0.512 12 | 0.826 16 | 0.786 17 | 0.178 17 | 0.549 13 | 0.277 16 | 0.659 16 | 0.381 16 | 0.518 15 | 0.295 18 | 0.323 15 | 0.777 13 | 0.599 11 | 0.028 10 | 0.321 12 | 0.363 17 | 0.000 1 | 0.708 16 | 0.858 15 | 0.746 11 | 0.063 15 | 0.022 5 | 0.457 16 | 0.077 11 | 0.476 12 | 0.243 16 | 0.402 15 | 0.397 18 | 0.233 11 | 0.077 16 | 0.720 18 | 0.610 17 | 0.103 6 | 0.629 13 | 0.437 18 | 0.626 12 | 0.446 15 | 0.702 6 | 0.190 14 | 0.005 1 | 0.058 17 | 0.322 15 | 0.702 17 | 0.244 16 | 0.768 15 | 0.000 8 | 0.134 13 | 0.552 16 | 0.279 17 | 0.395 15 | 0.147 17 | 0.000 1 | 0.207 16 | 0.612 14 | 0.000 4 | 0.000 10 | 0.000 1 | 0.000 6 | 0.658 12 | 0.566 15 | 0.323 16 | 0.525 16 | 0.229 13 | 0.179 9 | 0.467 18 | 0.154 17 | 0.000 3 | 0.002 6 | 0.000 1 | 0.051 1 | 0.000 4 | 0.127 4 | 0.703 13 | 0.000 1 | 0.000 11 | 0.216 1 | 0.112 17 | 0.358 12 | 0.547 2 | 0.187 10 | 0.092 17 | 0.156 18 | 0.055 11 | 0.296 16 | 0.252 10 | 0.143 6 | 0.000 5 | 0.014 14 | 0.398 7 | 0.000 3 | 0.028 17 | 0.173 8 | 0.000 15 | 0.265 17 | 0.348 15 | 0.415 17 | 0.179 9 | 0.019 17 | 0.218 9 | 0.000 1 | 0.597 9 | 0.274 17 | 0.565 14 | 0.000 1 | 0.012 9 | 0.000 13 | 0.039 17 | 0.022 3 | 0.000 11 | 0.117 16 | 0.000 13 | 0.000 8 | 0.000 11 | 0.000 1 | 0.000 5 | 0.324 17 | 0.000 1 | 0.384 10 | 0.000 1 | 0.000 13 | 0.251 18 | 0.000 1 | 0.566 12 | 0.000 1 | 0.000 1 | 0.066 15 | 0.404 5 | 0.886 14 | 0.199 2 | 0.000 12 | 0.000 1 | 0.059 7 | 0.000 1 | 0.136 1 | 0.540 6 | 0.127 18 | 0.295 12 | 0.085 7 | 0.143 6 | 0.514 7 | 0.413 16 | 0.000 12 | 0.000 1 | 0.498 9 | 0.000 2 | 0.000 2 | 0.000 12 | 0.623 13 | 0.000 3 | 0.000 1 | 0.000 1 | 0.132 16 | 0.000 7 | 0.000 3 | 0.000 12 | 0.000 1 | |||||||||||||||||||||||||||||
| David Rozenberszki, Or Litany, Angela Dai: Language-Grounded Indoor 3D Semantic Segmentation in the Wild. arXiv | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Minkowski 34D | 0.253 17 | 0.463 17 | 0.154 18 | 0.102 17 | 0.771 17 | 0.650 17 | 0.932 16 | 0.483 17 | 0.571 17 | 0.710 16 | 0.331 17 | 0.250 17 | 0.492 15 | 0.044 6 | 0.703 17 | 0.419 18 | 0.606 18 | 0.227 17 | 0.621 17 | 0.865 18 | 0.531 9 | 0.771 18 | 0.813 15 | 0.291 11 | 0.484 16 | 0.242 17 | 0.612 18 | 0.282 18 | 0.440 18 | 0.351 16 | 0.299 16 | 0.622 17 | 0.593 12 | 0.027 11 | 0.293 14 | 0.310 18 | 0.000 1 | 0.757 15 | 0.858 15 | 0.737 13 | 0.150 9 | 0.164 1 | 0.368 18 | 0.084 9 | 0.381 17 | 0.142 18 | 0.357 16 | 0.720 11 | 0.214 13 | 0.092 15 | 0.724 17 | 0.596 18 | 0.056 15 | 0.655 10 | 0.525 15 | 0.581 16 | 0.352 18 | 0.594 16 | 0.056 18 | 0.000 3 | 0.014 18 | 0.224 16 | 0.772 16 | 0.205 18 | 0.720 17 | 0.000 8 | 0.159 7 | 0.531 17 | 0.163 18 | 0.294 17 | 0.136 18 | 0.000 1 | 0.169 17 | 0.589 15 | 0.000 4 | 0.000 10 | 0.000 1 | 0.002 4 | 0.663 11 | 0.466 18 | 0.265 18 | 0.582 11 | 0.337 11 | 0.016 16 | 0.559 16 | 0.084 18 | 0.000 3 | 0.000 8 | 0.000 1 | 0.036 5 | 0.000 4 | 0.125 5 | 0.670 14 | 0.000 1 | 0.102 3 | 0.071 8 | 0.164 16 | 0.406 10 | 0.386 7 | 0.046 17 | 0.068 18 | 0.159 16 | 0.117 6 | 0.284 17 | 0.111 17 | 0.094 17 | 0.000 5 | 0.000 18 | 0.197 17 | 0.000 3 | 0.044 16 | 0.013 16 | 0.002 14 | 0.228 18 | 0.307 18 | 0.588 12 | 0.025 18 | 0.545 5 | 0.134 16 | 0.000 1 | 0.655 5 | 0.302 15 | 0.282 18 | 0.000 1 | 0.060 2 | 0.000 13 | 0.035 18 | 0.000 7 | 0.000 11 | 0.097 18 | 0.000 13 | 0.000 8 | 0.005 10 | 0.000 1 | 0.000 5 | 0.096 18 | 0.000 1 | 0.334 17 | 0.000 1 | 0.000 13 | 0.274 17 | 0.000 1 | 0.513 15 | 0.000 1 | 0.000 1 | 0.280 9 | 0.194 10 | 0.897 12 | 0.000 10 | 0.000 12 | 0.000 1 | 0.000 9 | 0.000 1 | 0.108 9 | 0.279 18 | 0.189 17 | 0.141 18 | 0.059 15 | 0.272 2 | 0.307 18 | 0.445 11 | 0.003 10 | 0.000 1 | 0.353 16 | 0.000 2 | 0.026 1 | 0.000 12 | 0.581 16 | 0.001 2 | 0.000 1 | 0.000 1 | 0.093 18 | 0.002 6 | 0.000 3 | 0.000 12 | 0.000 1 | |||||||||||||||||||||||||||||
| C. Choy, J. Gwak, S. Savarese: 4D Spatio-Temporal ConvNets: Minkowski Convolutional Neural Networks. CVPR 2019 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| OA-CNN-L_ScanNet200 | 0.333 12 | 0.558 6 | 0.269 10 | 0.124 14 | 0.821 6 | 0.703 4 | 0.946 7 | 0.569 6 | 0.662 5 | 0.748 10 | 0.487 4 | 0.455 5 | 0.572 8 | 0.000 14 | 0.789 10 | 0.534 10 | 0.736 10 | 0.271 9 | 0.713 5 | 0.949 7 | 0.498 15 | 0.877 4 | 0.860 12 | 0.332 7 | 0.706 1 | 0.474 3 | 0.788 7 | 0.406 14 | 0.637 7 | 0.495 12 | 0.355 12 | 0.805 8 | 0.592 13 | 0.015 13 | 0.396 8 | 0.602 6 | 0.000 1 | 0.799 12 | 0.876 8 | 0.713 14 | 0.276 2 | 0.000 7 | 0.493 14 | 0.080 10 | 0.448 15 | 0.363 6 | 0.661 5 | 0.833 7 | 0.262 7 | 0.125 8 | 0.823 13 | 0.665 10 | 0.076 10 | 0.720 9 | 0.557 11 | 0.637 10 | 0.517 10 | 0.672 11 | 0.227 9 | 0.000 3 | 0.158 12 | 0.496 9 | 0.843 12 | 0.352 11 | 0.835 14 | 0.000 8 | 0.103 15 | 0.711 6 | 0.527 5 | 0.526 7 | 0.320 9 | 0.000 1 | 0.568 7 | 0.625 12 | 0.067 1 | 0.000 10 | 0.000 1 | 0.001 5 | 0.806 7 | 0.836 8 | 0.621 11 | 0.591 9 | 0.373 9 | 0.314 5 | 0.668 11 | 0.398 10 | 0.003 2 | 0.000 8 | 0.000 1 | 0.016 16 | 0.024 2 | 0.043 14 | 0.906 7 | 0.000 1 | 0.052 7 | 0.000 10 | 0.384 13 | 0.330 13 | 0.342 9 | 0.100 13 | 0.223 8 | 0.183 14 | 0.112 7 | 0.476 6 | 0.313 8 | 0.130 10 | 0.196 4 | 0.112 12 | 0.370 11 | 0.000 3 | 0.234 13 | 0.071 10 | 0.160 7 | 0.403 7 | 0.398 14 | 0.492 15 | 0.197 7 | 0.076 14 | 0.272 6 | 0.000 1 | 0.200 17 | 0.560 10 | 0.735 8 | 0.000 1 | 0.000 12 | 0.000 13 | 0.110 9 | 0.002 6 | 0.021 9 | 0.412 5 | 0.000 13 | 0.000 8 | 0.000 11 | 0.000 1 | 0.000 5 | 0.794 12 | 0.000 1 | 0.445 6 | 0.000 1 | 0.022 11 | 0.509 7 | 0.000 1 | 0.517 14 | 0.000 1 | 0.000 1 | 0.001 18 | 0.245 8 | 0.915 6 | 0.024 7 | 0.089 8 | 0.000 1 | 0.262 3 | 0.000 1 | 0.103 11 | 0.524 8 | 0.392 12 | 0.515 4 | 0.013 18 | 0.251 4 | 0.411 14 | 0.662 5 | 0.001 11 | 0.000 1 | 0.473 13 | 0.000 2 | 0.000 2 | 0.150 6 | 0.699 10 | 0.000 3 | 0.000 1 | 0.000 1 | 0.166 6 | 0.000 7 | 0.024 2 | 0.000 12 | 0.000 1 | |||||||||||||||||||||||||||||
| IMFSegNet | 0.334 10 | 0.532 14 | 0.251 12 | 0.179 8 | 0.799 12 | 0.683 9 | 0.940 11 | 0.555 9 | 0.631 13 | 0.740 12 | 0.406 11 | 0.336 14 | 0.560 10 | 0.062 4 | 0.795 7 | 0.518 13 | 0.733 11 | 0.274 6 | 0.646 14 | 0.947 9 | 0.458 18 | 0.848 14 | 0.862 11 | 0.305 10 | 0.649 5 | 0.284 14 | 0.713 13 | 0.495 8 | 0.626 9 | 0.527 10 | 0.363 10 | 0.820 6 | 0.574 14 | 0.010 14 | 0.411 4 | 0.597 7 | 0.000 1 | 0.842 5 | 0.873 10 | 0.704 15 | 0.246 4 | 0.000 7 | 0.495 12 | 0.041 17 | 0.486 10 | 0.305 8 | 0.444 13 | 0.604 16 | 0.134 17 | 0.055 17 | 0.852 10 | 0.633 14 | 0.076 10 | 0.792 5 | 0.612 9 | 0.573 18 | 0.484 13 | 0.668 13 | 0.216 13 | 0.000 3 | 0.197 9 | 0.518 7 | 0.784 14 | 0.344 13 | 0.908 8 | 0.283 5 | 0.190 4 | 0.599 14 | 0.439 11 | 0.496 11 | 0.569 3 | 0.000 1 | 0.392 10 | 0.776 3 | 0.000 4 | 0.064 5 | 0.000 1 | 0.000 6 | 0.710 10 | 0.756 13 | 0.508 12 | 0.512 17 | 0.159 16 | 0.034 15 | 0.773 2 | 0.363 11 | 0.000 3 | 0.000 8 | 0.000 1 | 0.032 7 | 0.000 4 | 0.029 17 | 0.648 17 | 0.000 1 | 0.000 11 | 0.000 10 | 0.830 7 | 0.595 4 | 0.274 16 | 0.228 9 | 0.206 9 | 0.188 13 | 0.000 15 | 0.425 9 | 0.237 12 | 0.123 13 | 0.000 5 | 0.277 6 | 0.214 15 | 0.003 1 | 0.610 3 | 0.044 13 | 0.124 10 | 0.320 15 | 0.408 12 | 0.594 10 | 0.196 8 | 0.213 8 | 0.139 14 | 0.000 1 | 0.615 7 | 0.618 6 | 0.839 4 | 0.000 1 | 0.014 7 | 0.260 7 | 0.080 13 | 0.025 2 | 0.000 11 | 0.139 13 | 0.135 6 | 0.035 7 | 0.000 11 | 0.000 1 | 0.793 2 | 0.799 10 | 0.000 1 | 0.357 14 | 0.000 1 | 0.369 6 | 0.359 14 | 0.000 1 | 0.512 16 | 0.000 1 | 0.000 1 | 0.120 13 | 0.424 3 | 0.903 9 | 0.027 6 | 0.091 7 | 0.000 1 | 0.245 5 | 0.000 1 | 0.073 16 | 0.457 15 | 0.340 13 | 0.191 16 | 0.021 16 | 0.009 18 | 0.322 16 | 0.608 7 | 0.060 3 | 0.000 1 | 0.494 11 | 0.000 2 | 0.000 2 | 0.068 11 | 0.624 12 | 0.000 3 | 0.000 1 | 0.000 1 | 0.139 12 | 0.047 4 | 0.000 3 | 0.561 8 | 0.000 1 | |||||||||||||||||||||||||||||
| GSTran | 0.334 11 | 0.533 13 | 0.250 13 | 0.179 9 | 0.799 12 | 0.684 8 | 0.940 11 | 0.554 10 | 0.633 12 | 0.741 11 | 0.405 12 | 0.337 13 | 0.560 10 | 0.060 5 | 0.794 9 | 0.517 14 | 0.732 12 | 0.274 6 | 0.647 13 | 0.948 8 | 0.459 17 | 0.849 12 | 0.864 10 | 0.306 9 | 0.648 6 | 0.282 15 | 0.717 12 | 0.496 7 | 0.624 10 | 0.533 9 | 0.363 10 | 0.821 5 | 0.573 15 | 0.009 15 | 0.411 4 | 0.593 9 | 0.000 1 | 0.841 6 | 0.873 10 | 0.704 15 | 0.242 5 | 0.000 7 | 0.495 12 | 0.041 17 | 0.487 9 | 0.304 9 | 0.439 14 | 0.613 14 | 0.133 18 | 0.055 17 | 0.853 9 | 0.634 13 | 0.075 13 | 0.791 6 | 0.601 10 | 0.574 17 | 0.483 14 | 0.669 12 | 0.217 11 | 0.000 3 | 0.198 8 | 0.518 7 | 0.782 15 | 0.345 12 | 0.914 7 | 0.273 6 | 0.193 3 | 0.598 15 | 0.440 10 | 0.499 9 | 0.570 2 | 0.000 1 | 0.381 12 | 0.775 4 | 0.000 4 | 0.063 6 | 0.000 1 | 0.000 6 | 0.712 9 | 0.752 14 | 0.507 13 | 0.512 17 | 0.158 17 | 0.036 14 | 0.773 2 | 0.361 12 | 0.000 3 | 0.000 8 | 0.000 1 | 0.032 7 | 0.000 4 | 0.032 16 | 0.651 16 | 0.000 1 | 0.000 11 | 0.000 10 | 0.831 6 | 0.595 4 | 0.273 17 | 0.229 8 | 0.200 10 | 0.191 11 | 0.000 15 | 0.425 9 | 0.233 13 | 0.125 12 | 0.000 5 | 0.279 5 | 0.213 16 | 0.003 1 | 0.608 4 | 0.044 13 | 0.138 9 | 0.321 13 | 0.408 12 | 0.593 11 | 0.198 6 | 0.205 9 | 0.139 14 | 0.000 1 | 0.614 8 | 0.609 7 | 0.838 5 | 0.000 1 | 0.014 7 | 0.260 7 | 0.080 13 | 0.010 5 | 0.000 11 | 0.136 14 | 0.136 5 | 0.047 6 | 0.000 11 | 0.000 1 | 0.787 3 | 0.797 11 | 0.000 1 | 0.354 15 | 0.000 1 | 0.372 5 | 0.357 15 | 0.000 1 | 0.507 17 | 0.000 1 | 0.000 1 | 0.121 12 | 0.423 4 | 0.903 9 | 0.028 5 | 0.089 8 | 0.000 1 | 0.252 4 | 0.000 1 | 0.072 17 | 0.465 13 | 0.340 13 | 0.189 17 | 0.020 17 | 0.011 17 | 0.320 17 | 0.606 8 | 0.060 3 | 0.000 1 | 0.496 10 | 0.000 2 | 0.000 2 | 0.070 10 | 0.618 14 | 0.000 3 | 0.000 1 | 0.000 1 | 0.139 12 | 0.047 4 | 0.000 3 | 0.558 9 | 0.000 1 | |||||||||||||||||||||||||||||
| CSC-Pretrain | 0.249 18 | 0.455 18 | 0.171 17 | 0.079 18 | 0.766 18 | 0.659 16 | 0.930 18 | 0.494 15 | 0.542 18 | 0.700 18 | 0.314 18 | 0.215 18 | 0.430 18 | 0.121 1 | 0.697 18 | 0.441 17 | 0.683 17 | 0.235 15 | 0.609 18 | 0.895 17 | 0.476 16 | 0.816 17 | 0.770 18 | 0.186 15 | 0.634 7 | 0.216 18 | 0.734 9 | 0.340 17 | 0.471 17 | 0.307 17 | 0.293 18 | 0.591 18 | 0.542 16 | 0.076 7 | 0.205 17 | 0.464 15 | 0.000 1 | 0.484 18 | 0.832 17 | 0.766 8 | 0.052 16 | 0.000 7 | 0.413 17 | 0.059 15 | 0.418 16 | 0.222 17 | 0.318 18 | 0.609 15 | 0.206 14 | 0.112 10 | 0.743 15 | 0.625 15 | 0.076 10 | 0.579 16 | 0.548 14 | 0.590 15 | 0.371 17 | 0.552 18 | 0.081 17 | 0.003 2 | 0.142 14 | 0.201 17 | 0.638 18 | 0.233 17 | 0.686 18 | 0.000 8 | 0.142 9 | 0.444 18 | 0.375 14 | 0.247 18 | 0.198 15 | 0.000 1 | 0.128 18 | 0.454 18 | 0.019 2 | 0.097 1 | 0.000 1 | 0.000 6 | 0.553 15 | 0.557 16 | 0.373 14 | 0.545 15 | 0.164 15 | 0.014 17 | 0.547 17 | 0.174 16 | 0.000 3 | 0.002 6 | 0.000 1 | 0.037 4 | 0.000 4 | 0.063 11 | 0.664 15 | 0.000 1 | 0.000 11 | 0.130 2 | 0.170 15 | 0.152 17 | 0.335 11 | 0.079 15 | 0.110 16 | 0.175 15 | 0.098 9 | 0.175 18 | 0.166 16 | 0.045 18 | 0.207 3 | 0.014 14 | 0.465 5 | 0.000 3 | 0.001 18 | 0.001 18 | 0.046 12 | 0.299 16 | 0.327 17 | 0.537 13 | 0.033 17 | 0.012 18 | 0.186 11 | 0.000 1 | 0.205 16 | 0.377 13 | 0.463 17 | 0.000 1 | 0.058 3 | 0.000 13 | 0.055 16 | 0.041 1 | 0.000 11 | 0.105 17 | 0.000 13 | 0.000 8 | 0.000 11 | 0.000 1 | 0.000 5 | 0.398 16 | 0.000 1 | 0.308 18 | 0.000 1 | 0.000 13 | 0.319 16 | 0.000 1 | 0.543 13 | 0.000 1 | 0.000 1 | 0.062 16 | 0.004 14 | 0.862 16 | 0.000 10 | 0.000 12 | 0.000 1 | 0.000 9 | 0.000 1 | 0.123 5 | 0.316 17 | 0.225 16 | 0.250 14 | 0.094 3 | 0.180 5 | 0.332 15 | 0.441 12 | 0.000 12 | 0.000 1 | 0.310 17 | 0.000 2 | 0.000 2 | 0.000 12 | 0.592 15 | 0.000 3 | 0.000 1 | 0.000 1 | 0.203 3 | 0.000 7 | 0.000 3 | 0.000 12 | 0.000 1 | |||||||||||||||||||||||||||||
| Ji Hou, Benjamin Graham, Matthias Nießner, Saining Xie: Exploring Data-Efficient 3D Scene Understanding with Contrastive Scene Contexts. CVPR 2021 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| OctFormer ScanNet200 | 0.326 14 | 0.539 11 | 0.265 11 | 0.131 13 | 0.806 9 | 0.670 13 | 0.943 10 | 0.535 13 | 0.662 5 | 0.705 17 | 0.423 10 | 0.407 7 | 0.505 14 | 0.003 11 | 0.765 14 | 0.582 8 | 0.686 16 | 0.227 17 | 0.680 9 | 0.943 11 | 0.601 3 | 0.854 11 | 0.892 7 | 0.335 6 | 0.417 18 | 0.357 11 | 0.724 10 | 0.453 12 | 0.632 8 | 0.596 6 | 0.432 4 | 0.783 12 | 0.512 17 | 0.021 12 | 0.244 16 | 0.637 2 | 0.000 1 | 0.787 13 | 0.873 10 | 0.743 12 | 0.000 17 | 0.000 7 | 0.534 10 | 0.110 5 | 0.499 7 | 0.289 11 | 0.626 8 | 0.620 13 | 0.168 16 | 0.204 5 | 0.849 11 | 0.679 9 | 0.117 5 | 0.633 12 | 0.684 3 | 0.650 9 | 0.552 6 | 0.684 10 | 0.312 3 | 0.000 3 | 0.175 11 | 0.429 12 | 0.865 6 | 0.413 5 | 0.837 13 | 0.000 8 | 0.145 8 | 0.626 10 | 0.451 9 | 0.487 12 | 0.513 4 | 0.000 1 | 0.529 8 | 0.613 13 | 0.000 4 | 0.033 7 | 0.000 1 | 0.000 6 | 0.828 6 | 0.871 4 | 0.622 10 | 0.587 10 | 0.411 7 | 0.137 11 | 0.645 15 | 0.343 13 | 0.000 3 | 0.000 8 | 0.000 1 | 0.022 13 | 0.000 4 | 0.026 18 | 0.829 12 | 0.000 1 | 0.022 9 | 0.089 6 | 0.842 5 | 0.253 15 | 0.318 12 | 0.296 2 | 0.178 12 | 0.291 3 | 0.224 3 | 0.584 2 | 0.200 15 | 0.132 9 | 0.000 5 | 0.128 11 | 0.227 14 | 0.000 3 | 0.230 14 | 0.047 12 | 0.149 8 | 0.331 11 | 0.412 10 | 0.618 8 | 0.164 11 | 0.102 12 | 0.522 4 | 0.000 1 | 0.655 5 | 0.378 12 | 0.469 16 | 0.000 1 | 0.000 12 | 0.000 13 | 0.105 10 | 0.000 7 | 0.000 11 | 0.483 3 | 0.000 13 | 0.000 8 | 0.028 8 | 0.000 1 | 0.000 5 | 0.906 2 | 0.000 1 | 0.339 16 | 0.000 1 | 0.000 13 | 0.457 10 | 0.000 1 | 0.612 9 | 0.000 1 | 0.000 1 | 0.408 5 | 0.000 16 | 0.900 11 | 0.000 10 | 0.000 12 | 0.000 1 | 0.029 8 | 0.000 1 | 0.074 15 | 0.455 16 | 0.479 7 | 0.427 8 | 0.079 10 | 0.140 9 | 0.496 8 | 0.414 15 | 0.022 6 | 0.000 1 | 0.471 14 | 0.000 2 | 0.000 2 | 0.000 12 | 0.722 8 | 0.000 3 | 0.000 1 | 0.000 1 | 0.138 14 | 0.000 7 | 0.000 3 | 0.000 12 | 0.000 1 | |||||||||||||||||||||||||||||
| Peng-Shuai Wang: OctFormer: Octree-based Transformers for 3D Point Clouds. SIGGRAPH 2023 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| BFANet ScanNet200 | 0.360 6 | 0.553 8 | 0.293 6 | 0.193 6 | 0.827 5 | 0.689 5 | 0.970 3 | 0.528 14 | 0.661 7 | 0.753 7 | 0.436 9 | 0.378 9 | 0.469 16 | 0.042 7 | 0.810 3 | 0.654 3 | 0.760 5 | 0.266 11 | 0.659 11 | 0.973 5 | 0.574 4 | 0.849 12 | 0.897 6 | 0.382 3 | 0.546 14 | 0.372 10 | 0.698 14 | 0.491 9 | 0.617 11 | 0.526 11 | 0.436 2 | 0.764 15 | 0.476 18 | 0.101 5 | 0.409 6 | 0.585 10 | 0.000 1 | 0.835 7 | 0.901 3 | 0.810 6 | 0.102 14 | 0.000 7 | 0.688 3 | 0.096 7 | 0.483 11 | 0.264 13 | 0.612 10 | 0.591 17 | 0.358 2 | 0.161 7 | 0.863 6 | 0.707 5 | 0.128 4 | 0.814 3 | 0.669 4 | 0.629 11 | 0.563 5 | 0.651 15 | 0.258 5 | 0.000 3 | 0.194 10 | 0.494 10 | 0.806 13 | 0.394 7 | 0.953 6 | 0.000 8 | 0.233 1 | 0.757 5 | 0.508 7 | 0.556 5 | 0.476 5 | 0.000 1 | 0.573 6 | 0.741 6 | 0.000 4 | 0.000 10 | 0.000 1 | 0.000 6 | 0.000 18 | 0.852 6 | 0.678 4 | 0.616 7 | 0.460 5 | 0.338 3 | 0.710 6 | 0.534 6 | 0.000 3 | 0.025 5 | 0.000 1 | 0.043 3 | 0.000 4 | 0.056 13 | 0.493 18 | 0.000 1 | 0.000 11 | 0.109 5 | 0.785 8 | 0.590 6 | 0.298 14 | 0.282 3 | 0.143 14 | 0.262 5 | 0.053 12 | 0.526 4 | 0.337 6 | 0.215 1 | 0.000 5 | 0.135 9 | 0.510 4 | 0.000 3 | 0.596 5 | 0.043 15 | 0.511 3 | 0.321 13 | 0.459 4 | 0.772 2 | 0.124 14 | 0.060 15 | 0.266 7 | 0.000 1 | 0.574 10 | 0.568 9 | 0.653 11 | 0.000 1 | 0.093 1 | 0.298 5 | 0.239 3 | 0.000 7 | 0.516 3 | 0.129 15 | 0.284 2 | 0.000 8 | 0.431 1 | 0.000 1 | 0.000 5 | 0.848 7 | 0.000 1 | 0.492 2 | 0.000 1 | 0.376 4 | 0.522 6 | 0.000 1 | 0.469 18 | 0.000 1 | 0.000 1 | 0.330 7 | 0.151 11 | 0.875 15 | 0.000 10 | 0.254 5 | 0.000 1 | 0.000 9 | 0.000 1 | 0.088 13 | 0.661 1 | 0.481 6 | 0.255 13 | 0.105 1 | 0.139 10 | 0.666 5 | 0.641 6 | 0.000 12 | 0.000 1 | 0.614 3 | 0.000 2 | 0.000 2 | 0.000 12 | 0.921 2 | 0.000 3 | 0.000 1 | 0.000 1 | 0.497 1 | 0.000 7 | 0.000 3 | 0.000 12 | 0.000 1 | |||||||||||||||||||||||||||||
| Weiguang Zhao, Rui Zhang, Qiufeng Wang, Guangliang Cheng, Kaizhu Huang: BFANet: Revisiting 3D Semantic Segmentation with Boundary Feature Analysis. CVPR 2025 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
